人間による形態素解析結果 | 1位候補 |
日本橋%大伝馬![]() ![]() |
日本橋%大伝馬![]() ![]() |
日本+経済+新聞%長瀬+販売![]() |
日本%経済+新聞%長瀬+販売![]() |
能代%国道+維持+出張![]() |
能代%国道+維持%出張![]() |
萩原+カイロプラクティック | 萩原%カイロプラクティック |
白峰![]() ![]() ![]() |
白峰![]() ![]() ![]() |
八百松![]() |
八百松+亭 |
飯坂![]() |
飯坂+新%会館 |
美瑛![]() |
美瑛![]() |
浜田![]() ![]() ![]() |
浜田![]() ![]() ![]() |
富山![]() ![]() ![]() ![]() |
富山![]() ![]() ![]() ![]() |
富士宮%ホワイト%テニス+クラブ | 富士宮%ホワイト+テニス+クラブ |
部落%解放+同盟%鹿児島![]() ![]() |
部落%解放+同盟%鹿児島![]() ![]() |
人間による形態素解析結果 | 1位候補 |
神結+酒造 | 神%結%酒造 |
神緑+薬局 | 神%緑%薬局 |
紳士服![]() |
紳士![]() ![]() |
諏訪山+公園%管理+事務![]() |
諏訪![]() ![]() |
杉の沢 | 杉![]() |
世海 | 世%海 |
瀬古勝+製菓![]() |
瀬古%勝+製菓![]() |
瀬川%米穀+酒類![]() |
瀬川%米穀+酒![]() ![]() |
栖来![]() |
栖%来%寺 |
本実験では、人間によって与えられた形態素解析結果と完全に一致する候補を
正解として計算した。しかし、アクセント句境界と単語境界は特に曖昧である。
そのため、正解と見なせる候補を誤りとしている例も多い。そのため、全探索
法において-gramを使用した実験結果において、単語区切りの場所が同じで
種類が異なる件数を調査した。この数は793件あった。この例を表
2に示す。これらを正解にすると 1位正解率は91%になる。
また、単語区切りの場所が違うものは944件あった。この例を表3 に示す。この結果をみると、人間による形態素解析結果が誤っていると思われ る例もある。これらの例を除くと実際の正解率はかなり高いと思われる。