メールと言えば、今までスパムの全然来なかったw4ard@s26.xrea.comにも、このサイトのページがGoogleに拾われたり、w3c-translators@w3.orgのアーカイブが拾われたりしているせいか、少し(本当に少し)スパムが来始めました。ウェブサイトの作成者さんの中には、メールアドレス収集ロボットに拾われないように直接記載する事を避ける人もいるようですが、悪意を持った人間には無力です(そう言う人が来るのかどうかは知らないですけど)。それに、mailtoプロトコル(なのかな?)でリンクを張って手軽に送れるようにしていないと、メールを送信しようとしてくれた人も面倒に思って止めてしまうかも知れません。それに、ウェブページにメールアドレスを記載しなくても、知らない所で名簿屋にアドレスが売られているなんて事もあるので(うちのプロバイダのメールアドレスも、未公開にも拘わらず一時期大量にスパムに遭ったし)、直前に防壁が欲しい所です。
なーんて、何だか通信販売の前置きみたいな繋ぎを書きましたが、要はPOPFileを紹介したかっただけです。有名っぽいので既に御存知の方もいるでしょうが、ベイズ理論を利用してメールのフィルタリングを行う中継サーバソフトです。簡単な手順の学習を少しする事によって、普通のメールとスパムを分別したり、もっと高度な分類を行う事もできます。ちなみに、僕のPOPFileの記録では、1062通のメールの内、分類を間違えたのは17通だけ(それも殆ど最初の内だけ)です。精度は98.39%。これでスパムを無視し続けていたせいか、プロバイダのメールアカウントで一時期酷かったスパムも、最近は殆ど来なくなりました。
ベイズ理論てのは、あれですね……「Aという単語が見つかった時、そのメールがスパムである確率」を「メールがスパムであった時、そのAという単語が含まれていた確率」などに置き換えられるような感じの(数式出すのは面倒くさい)。単純ですが、ここまで便利なものだったとは。
しかしまあ、何と言うか……。これ、どこがプログラミングに関する覚え書きがメインのウェブログ
なんだか。
コメントする