| 人間による形態素解析結果 | 1位候補 |
| 日本橋%大伝馬 |
日本橋%大伝馬 |
| 日本+経済+新聞%長瀬+販売 |
日本%経済+新聞%長瀬+販売 |
| 能代%国道+維持+出張 |
能代%国道+維持%出張 |
| 萩原+カイロプラクティック | 萩原%カイロプラクティック |
| 白峰 |
白峰 |
| 八百松 |
八百松+亭 |
| 飯坂 |
飯坂+新%会館 |
| 美瑛 |
美瑛 |
| 浜田 |
浜田 |
| 富山 |
富山 |
| 富士宮%ホワイト%テニス+クラブ | 富士宮%ホワイト+テニス+クラブ |
| 部落%解放+同盟%鹿児島 |
部落%解放+同盟%鹿児島 |
| 人間による形態素解析結果 | 1位候補 |
| 神結+酒造 | 神%結%酒造 |
| 神緑+薬局 | 神%緑%薬局 |
| 紳士服 |
紳士 |
| 諏訪山+公園%管理+事務 |
諏訪 |
| 杉の沢 | 杉 |
| 世海 | 世%海 |
| 瀬古勝+製菓 |
瀬古%勝+製菓 |
| 瀬川%米穀+酒類 |
瀬川%米穀+酒 |
| 栖来 |
栖%来%寺 |
本実験では、人間によって与えられた形態素解析結果と完全に一致する候補を
正解として計算した。しかし、アクセント句境界と単語境界は特に曖昧である。
そのため、正解と見なせる候補を誤りとしている例も多い。そのため、全探索
法において
-gramを使用した実験結果において、単語区切りの場所が同じで
種類が異なる件数を調査した。この数は793件あった。この例を表
2に示す。これらを正解にすると 1位正解率は91%になる。
また、単語区切りの場所が違うものは944件あった。この例を表3 に示す。この結果をみると、人間による形態素解析結果が誤っていると思われ る例もある。これらの例を除くと実際の正解率はかなり高いと思われる。