next up previous contents
次へ: WWWからのテキスト収集と解析 上へ: 研究背景と目的 戻る: 日本語単文の意味分類体系   目次

形態素解析プログラム

形態素解析とは,自然言語処理技術の1つで,文を形態素に分割し品詞を見分け ることである.形態素とは,意味をもつ最 小の要素のことで,文は形態素から成り立っている.本研究で使った文型パター ンパーサの形態 素解析プログラムは,分割した品詞に意味属性が付与できる.意味属性コードを 見るとその単語がどういった意味を持っているのかが分かる.次ページに実行例 を示す.

実行例
入力文:みんなのおうちのまわりや公園、林や水辺にはどんな虫が生きているの かな?
出力結果
1. /みんな(1710,NI:5)
2. +の(7410)
3. /お(6180,御)
4. +うち(1100,家,NI:865,NI:387,NI:447,KR:2408k00,KR:6804k26,KR:2408k01,KR:6804k27,
IM:1220,IM:1420,IM:1470,IM:2120,IM:2130,IM:3660)
5. +の(7410)
6. /まわり(1410,回り,NI:2655,NI:2666,NI:2114,KR:1602z93,KR:4910h00,IM:5360,IM:5370,
IM:53C2,IM:68B0,IM:68C0)
7. +や(7440)
8. /公園(1100,NI:367,NI:423,NI:889,KR:3200u01,IM:1410,IM:2110,IM:3660)
9. +、(0210)
10. /林(1100,NI:513,KR:0106u28,IM:2500)
11. +や(7440)
12. /水辺(1100,NI:490,NI:2667,KR:4915u60,KR:8100v19,KR:4915u59,KR:8100v18,IM:2340,
IM:68C0)
13. +に(7430)
14. +は(7530)
15. /どんな(4200)
16. /虫(1100,NI:1841,NI:549,NI:548,KR:0000q27,KR:2502q13,KR:4403s00,KR:6912q00,IM:3150)
17. +が(7410)
18. /生き(2213,生きる,NY:2,NY:5,KR:0000a00,KR:0001a05,KR:5405a03,IY:2210,IY:5421,
IY:5960)
19. +ている(2817,,ている)
20. /の(1800)
21. +かな(7700,か)
22. +?(0120)
23. /nil



平成18年5月30日