木曜日, 6月 07, 2007

[Linux] 全文検索のサンプルデータ

青空文庫のデータを、全文検索の対象データにする方法を紹介しているサイト(意図は違うけど)があった。意外に性能測定のデータって何にしようと結構悩むのでメモ。

ちなみに、当てる側のサンプルとして、まったく無作為にいくならICOTの形態素辞書を使うのがよいかと思っている。

0 件のコメント: