POPFileでメール分別

| コメント(0) | トラックバック(0)

概要: メールと言えば、今までスパムの全然来なかったw4ard@s26.xrea.comにも、このサイトのページがGoogleに拾われたり、w3c-translators@w3.orgのアーカイブが拾われたり...

メールと言えば、今までスパムの全然来なかったw4ard@s26.xrea.comにも、このサイトのページがGoogleに拾われたり、w3c-translators@w3.orgのアーカイブが拾われたりしているせいか、少し(本当に少し)スパムが来始めました。ウェブサイトの作成者さんの中には、メールアドレス収集ロボットに拾われないように直接記載する事を避ける人もいるようですが、悪意を持った人間には無力です(そう言う人が来るのかどうかは知らないですけど)。それに、mailtoプロトコル(なのかな?)でリンクを張って手軽に送れるようにしていないと、メールを送信しようとしてくれた人も面倒に思って止めてしまうかも知れません。それに、ウェブページにメールアドレスを記載しなくても、知らない所で名簿屋にアドレスが売られているなんて事もあるので(うちのプロバイダのメールアドレスも、未公開にも拘わらず一時期大量にスパムに遭ったし)、直前に防壁が欲しい所です。

なーんて、何だか通信販売の前置きみたいな繋ぎを書きましたが、要はPOPFileを紹介したかっただけです。有名っぽいので既に御存知の方もいるでしょうが、ベイズ理論を利用してメールのフィルタリングを行う中継サーバソフトです。簡単な手順の学習を少しする事によって、普通のメールとスパムを分別したり、もっと高度な分類を行う事もできます。ちなみに、僕のPOPFileの記録では、1062通のメールの内、分類を間違えたのは17通だけ(それも殆ど最初の内だけ)です。精度は98.39%。これでスパムを無視し続けていたせいか、プロバイダのメールアカウントで一時期酷かったスパムも、最近は殆ど来なくなりました。

ベイズ理論てのは、あれですね……「Aという単語が見つかった時、そのメールがスパムである確率」を「メールがスパムであった時、そのAという単語が含まれていた確率」などに置き換えられるような感じの(数式出すのは面倒くさい)。単純ですが、ここまで便利なものだったとは。

しかしまあ、何と言うか……。これ、どこがプログラミングに関する覚え書きがメインのウェブログなんだか。

トラックバック(0)

トラックバックURL: http://w4ard.s26.xrea.com/program/mt/mt-tb.cgi/38

コメントする

このブログ記事について

このページは、E+Xが2007年5月 8日 19:02に書いたブログ記事です。

ひとつ前のブログ記事は「XML 1.1 (第二版)へのコメントなど随時歓迎中」です。

次のブログ記事は「スレッドの実行順序を支配する」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。