next up previous
Next: 文型数の調査 Up: 得られた日英対訳パターン Previous: 得られた日英対訳パターン

変数化された単語


単文215,242件を変数化し,単文の文型パターンを作成する.変数化された単語の割 合を調査するため,日英対訳文中の日本語文の形態素解析によって判断された品 詞の単語数を数える.また,日英対訳辞書によって変数化された単語数を数える.変数 化できた単語の割合を品詞別に表3に示す.


Table 3: 変数化された単語の割合
品詞 単語数 変数化単語数 変数化の割合[%]
名詞 495,720 229,781 46.35
固有名詞 25,802 10,963 42.48
副詞 31,477 10,011 31.80
連体詞 50,588 21,159 41.82
代名詞 81,218 48,932 60.24
形容詞 38,343 12,497 32.59
動詞 177,129 51,744 29.21
すべての品詞 900,277 385,087 42.8



すべての品詞を変数化した結果,日英対訳辞書によって42.8%の単語が自動的に変数化されたことが示された.

next up previous
Next: 文型数の調査 Up: 得られた日英対訳パターン Previous: 得られた日英対訳パターン
Jin'ichi Murakami 2006-03-11