next up previous
Next: 変数番号の問題点 Up: 変数化の問題点 Previous: 変数化失敗の原因

変数化の改良点


単文100件において形態素解析によって名詞と判断された単語は, 222個であった.変数化できた単語は,111個であった.以下の表6に変 数化できなかった単語111個を(5.1.1節)のA〜Eに分類した結果を示す.


Table 6: 変数化できなかった名詞単語の分類
分類 単語の個数[個] 割合[%]
35 32
9 8
53 48
7 6
7 6



上記の分類のAとDは辞書を強化することで、Bは変数化プログラ ムを改良することで変数化できる.しかし,Cの問題を自動的に解決するのは難 しく,人手による判断が必要である.
また,その他の品詞につ いて検証した所,固有名詞,副詞,形容詞は100件中,単語の出現回数が20回未 満と少なかったため,変数化できない原因の傾向がつかめなかった.連体詞につ いては,辞書を強化すること,代名詞については,代名詞の所有格も変数化する ことでほぼすべての単語が変数化できる.動詞に関しては,複合動詞の変数化と 辞書の強化が必要である.
従って,辞書の強化と変数化プログ ラム改良で変数化できる単語の割合が全体的に約50%増加すると予想される.



Jin'ichi Murakami 2006-03-11