スパムフィルタの検討

現状、POPFileの精度、そして、複数のバケツを使ったIMAPフォルダ上での自動振り分けには十分満足しているのだが、いずれは自前のメール(IMAP)サーバは無くして、プロバイダに預けて運用するという最終的な方針を考えると、POPFileの使用をそろそろやめることを検討しなくてはいけない。 POPFileによる自動振り分けは非常に便利なのだが、POPFileのIMAP対応がINBOXをスキャンし振り分けるというサーバ側での動作なので、自前のメールサーバを持たない限りは使いにくい。 どこかで妥協しなくてはならないので、プロバイダのメールサーバを使うことを優先とし、POPFileの使用をあきらめることにする。 rally.or.jp、rally.jpのアドレスは残すが、IMAPをサポートしているプロバイダを使用するのであれば、外部にメール委託をしても大きな問題はない。 また、外部からのメールの参照も、GMailへの転送が可能な限り、大きな問題にはならないだろう。 さらに言えば、どのクライアントからも保存したメールを読むことができるというIMAP自体は非常に便利ではあるのだが、実際にサーバに大量のメールをため込んでしまうと、通信によるオーバーへッドが大きい。 Thunderbirdで実装された全文検索機能などでは大きな弱点になる。 また、サーバが遠い場所にある場合のフォルダスキャンなどの待ち時間も長くなってしまう。 大規模組織かつ通信速度が高速である場合は、本来のIMAPが生き、ストレージをまとめることができるというメリットも大きくなるのだろうが... ということで、一定期間が経過したメール、単に記録として取っているレベルのメールは、IMAPフォルダからクライアントに移してしまい、IMAPフォルダは可能な限り軽量にしておくという運用を考えよう。 こうなると、POPFileの自動振り分けよりも、IMAPフォルダからローカルに振り分けることが可能なThunderbirdの振り分けの方が都合がよい。 前置きが非常に長くなったが、要するにPOPFileはやめて、新規のスパムフィルタを導入したいと言うことだ。 SpamAssassinBogofilterb、bsfilterの3つが有名どころ。 bsfilterは日本人が開発していると言うこともあり、日本語対応については一番安心感がある。そういえば、以前は使っていて、不満もなかった。Rubyで動く。 Bogofilterは、そのままではどうやら、日本語の扱いがあまりうまくないらしい。ただ、Cで作られているゆえに、動作は軽いだろう。 bogofilter を正しく使おうという、日本語をうまく扱う方法も見つかったが、ちょっと面倒だ。 そして、SpamAssassinは、Perl製と言うことで、若干重いと思われるが、多機能で拡張性も高く、ベイジアンフィルタ以外によるSpam発見機能が豊富。 ただ、若干日本語の対応には難があり、日本語パッチをあてる必要がありそうだ。 日本語対応パッチをあてるというのは、yumによりSpamqAssassinをインストールして使おうと考えている僕には、向かない手段だ。 さらに、日本語パッチは、3.2.5のものまでしか出ておらず、yumでインストールすることもできない。 ウノウラボ Unoh Labs: ベンチャー流のスパムメール対策術(後編) この実験では、どうやら日本語対応パッチをあてていないSpamAssassinとbsfilterでは速度がほぼ変わらない。 そこで、結局のところ、これを参考にSpamAssassinnをまず試してみることにした。

このブログ記事について

このページは、norが2010年4月 9日 10:42に書いたブログ記事です。

ひとつ前のブログ記事は「インストール: Namazu for Windows 2.0.20 (アーカイブ001) and search-s for Namazu 0.9.2」です。

次のブログ記事は「インストール: SpamAssassin 3.2.5 + 日本語パッチ」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

アーカイブ

ウェブページ

Powered by Movable Type 6.8.5