日曜日, 3月 11, 2007

[search] SenとMeCab

Luceneの日本語分かち書き(≒形態素解析?と書いていいのか?)はsenを使っていて,これはMeCabのJavaポートと言われる.がsenのホームページを見る限りMeCabのv0.77版ポートから進化していない様子..

MeCabはv0.90以降でなにやら大幅な改変がなされている様子なので,,,やはりSWIG経由でMeCabを呼ぶ形に直したほうがよいのだろうか(直せるのかわからないけど).

0 件のコメント: