Next: 変数番号の問題点
Up: 変数化の問題点
Previous: 変数化失敗の原因
単文100件において形態素解析によって名詞と判断された単語は,
222個であった.変数化できた単語は,111個であった.以下の表6に変
数化できなかった単語111個を(5.1.1節)のA〜Eに分類した結果を示す.
Table 6:
変数化できなかった名詞単語の分類
分類 |
単語の個数[個] |
割合[%] |
A |
35 |
32 |
B |
9 |
8 |
C |
53 |
48 |
D |
7 |
6 |
E |
7 |
6 |
上記の分類のAとDは辞書を強化することで、Bは変数化プログラ
ムを改良することで変数化できる.しかし,Cの問題を自動的に解決するのは難
しく,人手による判断が必要である.
また,その他の品詞につ
いて検証した所,固有名詞,副詞,形容詞は100件中,単語の出現回数が20回未
満と少なかったため,変数化できない原因の傾向がつかめなかった.連体詞につ
いては,辞書を強化すること,代名詞については,代名詞の所有格も変数化する
ことでほぼすべての単語が変数化できる.動詞に関しては,複合動詞の変数化と
辞書の強化が必要である.
従って,辞書の強化と変数化プログ
ラム改良で変数化できる単語の割合が全体的に約50%増加すると予想される.
Jin'ichi Murakami
2006-03-11