やはり、所有する文書の全文検索は欲しい。
対象文書は、最低限テキスト、Word、Excel、PDF。Thunderbirdのメールデータも検索できればうれしいが、Thunderbird自体の検索機能を使えばよいので、必須ではない。
フリーソフトなどでもいくつかあるが、メインテナンスの安心感から最終候補として上がったのは以下の3つ。これらは、いずれもプラグインで検索対象を追加できる。
Windows デスクトップ サーチ(WDS)
長所
- OS開発元のものなので、若干の安心感。
- アイドルタイムにインデックス作成を行う。
- IFilterで様々なファイル形式に対応できる(Windows Searchで様々なファイルを検索する - memo.xight.org、IFilter dot org)。
- XMPメタデータを使った検索もできる(SeaGate Blog: WindowsデスクトップサーチでXMPメタデータの検索)。
- インクリメンタルサーチが可能。
短所
- Adobe PDF IFilter 6.0では、PDF検索がうまくいかないらしい(Acrobat 8付属のIFilter 8を使うとうまく行くかも?)。
- Foxit PDF IFilterを使えばうまくいくようだ(Windows Vista 64bit 版 での PDF 全文検索)。
Googleデスクトップ(GDS)
長所
- GoogleのWeb検索との統合。
- Thunderbirdのメールデータも検索できる。
- 様々なファイル形式に対応したプラグインが開発されている。
- Google Desktop Gadgets
短所
- 大きなファイルは、先頭の英単語レベルで75,000文字まで、日本語レべルで4000語程度しかインデックスされない(ファイル : アイテムを検索できない - Windows 用デスクトップ ヘルプ)。
- 標準のPDF検索では、透明テキストやスキャンされた画像が含まれているPDFは検索できない(GoogleXdocや、Xpdfテキスト付属のPDFtoTextを使えば可能)。
Namazu
長所
- オープンソース故の、開発の継続性および発展性。
- search-s for Namazuを使えば、GUIでも使える。
短所
- インデックス作成のタイミングは、自分で指定する必要がある。