スパムやハム?
2009年5月13日デイビッドブラッドリー> > コメントしてください
ウェブの新しいアプローチをお使いのメールプログラムのフィルタを使うことが習慣の閲覧にスパムフィルタリング スパム ハムとして下さい。
は、自分のWebサーフィン習慣を次のようにしてお客様のメールから迷惑メールをフィルタリングする日本の研究者によって開発されているこの現象を使用するコンピュータのデスクトップシステム。
大樹Takashita剛Itokawa 、輝明Kitasuka 、正義Aritsugi通信工学コンピュータサイエンス学科の熊本大学では、どのようにシステムは、ユーザーがウェブと、これらのハムの単語との区別を参照する方法に基づいて"ハム"を説明する言葉を見つける"スパム"の言葉は、ユーザーの受信メールに記載されている。 "この方法は、 "研究者たちは、スパムフィルタは、面倒なメンテナンスの低減は、通常、ユーザーがフィルタリングされていない偽陰性またはブラックリストは、特定のスパムメールを確認している。
"我々 の方法を正しくフィルタを使用して 、 既存のベイズ統計情報を分類するのは難しいですが 、 スパムを検出することができる"と、 チームは、 "我々 は 、 ベイジアンフィルタを組み合わせて 、 我々のメソッドはfalseネガの数を低減詳細言う。 "
2001年には、インターネット経由で電子メールトラフィックのわずか5 %となった一方的なマーケティングメッセージは、豚肉製品の均質化後に"スパム"と呼ばれる英国のコメディーチームモンティパイソンで有名にユーモラスな曲"スパム、スパム、スパム... "今日の資格で作らと、推測されている間に90と95 %の すべての電子メールをスパムしている または悪意のあるペイロードの一部を形成する。 一部の観測筋がある可能性があり、メールのスパムを提案 深刻な環境結果 コンピュータとユーザーの時間をインターネットのトラフィックのような広大な流れを管理する上での膨大な量の無駄だ。
2つの主要な反スパム技術:送信者側の技術は、早い段階で動作し、悪意のあるユーザーは、最初の場所で、スパムの送信を防止するために設計されています。 ソースと、スパム、スパムボットのネットワークの存在は、毎日何百万人のメッセージを送ることができる、世界中のコンピュータから建設した大規模分散型の性質を考えると、これはほとんど実施することは困難です。
このように、迷惑メールの管理は通常のレシーバを使用して対応していますが、メールのいずれかのレベルの会社でGoogleのメールの場合は( )で、インターネットサービスプロバイダ( ISP )レベルで動作するか、ユーザの電子メールプログラムの側の技術、 。 制御、スパムTakashitaや同僚への小説のアプローチを提供するには、後者に重点を置いている:フィルタリング。
スパムフィルタは非常に多くのアプローチをご利用いただけます。 最も単純な単語のスパムのブラックリストを作成します。 これらの単語の場合はスパムとしてラベル付けされている受信メールに記載されています。 追加のフィルタWebアドレスは、受信メールに埋め込まれたタグを割り当てるとは、スパムメールにあるURLの場合はしきい値の数以上いる場合、ブラックリストに見えるかもしれませんが、それらのサイトのURLをポイントまたはいくつかの方法で難読化されています。 このURLのフィルタリングのアプローチも、フィッシング詐欺のメッセージをフィルタリングできます。
任意の時点でメールをユーザが手動でフラグをスパムとして、メールやデフラグはハムメール。 ベイズ統計を増大させることによって、このフィルタリング手法を自動化する" "からのメールは、ブラックリストに載っているか、新しい電子メール内の単語の組み合わせは統計をホワイトリスト、スパムやハム学習を提案する可能性があります使用されています。
一つのことも、ほとんどの電子メールユーザーのコンピュータとは、ウェブを閲覧することです。 Takashitaや同僚を抽出は、ユーザーの好みのWebブラウジングの習慣に基づいて、この現象を、従来のベイズメールのフィルタリングを組み合わせることで、電子メールとスパムをフィルタリングに適用されるフィルタリングのアルゴリズムの開発に役立つために、この事実を利用している。 彼らのアプローチは単にデスクトップツールに供給されプライバシーの問題として完全にクライアント側のデータを参照して行われます呼び起こす。 必要性では、ツールを使って、または実行すると、 Webブラウザやメールプログラム。
方法を3段階で構成さ:最初の段階で閲覧したWebページからのハムの単語リストを作成し 、 このリストには 、 統計的分析を適用すると、第2段階、第3段階 、 ハムの単語リストで電子メールを受け取ったのは 、 フィルタリング機能を提供は任意ですが、介入し 、 ホワイトリストやブラックリストを誤って判断されているメールは 、 ユーザーことができます。
このアプローチの予備的なテストでは、虚偽のネガの半分の数を数千人の電子メールをフィルタリングではフィルタリングのテストに比べて管理している使用ベイズ統計だけ。
それはかなり巧妙な音が、私はすぐに問題は、このアプローチで考えることができるのは、関心を 特定のニッチサイトを訪問 特に体の部分に言及必ずしも希望のメールを読むの拡大を懸念していないとしている体の部分を翻訳。 以上の深刻な、といって、特定の疾患の医療に関する情報を受信するには無限のマーケティング探しているということではありませんが、特定の病気の薬を提供するメールを送信する。 私はいくつかの他の例は、私のジャーナリズムのブラウジング習慣につながる可能性がほとんどない場合は、スパムフィルタリングされると思うかもしれないのよ!
大樹Takashita剛Itokawa 、輝明Kitasuka 、 &正義Aritsugi ( 2008 ) 。 国際スパムのフィルタリングのためにウェブの閲覧行動からユーザーの好みの展開。 (2), 126-138 J.高度な知能パラダイム、 1 ( 2 ) 、 126 〜 138


















0レスポンスこれまでのところ↓
が何かを追加するには? ご希望のコメントを以下に残す
コメントを残しなさい