プロフィール

KimZo

Author:KimZo
最近Laszloを知ってハマりそうな予感。
AjaxとFlashを同じソースで切り換えられたら無敵じゃないの?と考える横浜市青葉区の住人。

以下運営

ウサギ公開中。

ウサギ公開中。

Pebbleブログ[アタマノオト]

Laszloブログ[Laszlog]


最近の記事
最近のコメント
最近のトラックバック
月別アーカイブ
カテゴリー
ブロとも申請フォーム
ブログ内検索
RSSフィード
リンク
商品無料仕入れ戦隊『電脳卸』
スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。



スポンサー広告 | --/--/--(--) --:-- | |
形態素解析 Senでハマったメモ[辞書]
Javaによる日本語の形態素解析プログラムのSENを利用しようとして、
辞書関連でハマル。

SenのProjectのFAQ



  • 2004-10-13 (水) 22:27:18 たての? : 辞書に未登録な単語が未知語になるのは理解できますが、辞書生成(ant create)前のdic.csvに登録されている(IPADICの.dicファイルに最初からある)単語も未知語になってしまっています。


と有り、バージョンは違うけど同様の現象が起た。
中途半端に解析されるのだが、解析されてしかるべき単語が未知語だったりする。

結論としては、辞書作成Antが失敗していたらしい(中途ハンパに)。

ant clean

を実行し、再度辞書をbuildすると、最初作成したときより何倍も時間がかかって、
サイズも何倍もの辞書が生成された。

テストすると気持ちいいくらい綺麗に結果が出てきた。
Sen使えるね~
スポンサーサイト



未分類 | 2006/05/31(水) 14:55 | Trackback:(0) | Comments:(0)
コメントの投稿
管理者にだけ表示を許可する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。