Next: 文型数の調査
Up: 得られた日英対訳パターン
Previous: 得られた日英対訳パターン
単文215,242件を変数化し,単文の文型パターンを作成する.変数化された単語の割
合を調査するため,日英対訳文中の日本語文の形態素解析によって判断された品
詞の単語数を数える.また,日英対訳辞書によって変数化された単語数を数える.変数
化できた単語の割合を品詞別に表3に示す.
Table 3:
変数化された単語の割合
品詞 |
単語数 |
変数化単語数 |
変数化の割合[%] |
名詞 |
495,720 |
229,781 |
46.35 |
固有名詞 |
25,802 |
10,963 |
42.48 |
副詞 |
31,477 |
10,011 |
31.80 |
連体詞 |
50,588 |
21,159 |
41.82 |
代名詞 |
81,218 |
48,932 |
60.24 |
形容詞 |
38,343 |
12,497 |
32.59 |
動詞 |
177,129 |
51,744 |
29.21 |
すべての品詞 |
900,277 |
385,087 |
42.8 |
すべての品詞を変数化した結果,日英対訳辞書によって42.8%の単語が自動的に変数化されたことが示された.
Next: 文型数の調査
Up: 得られた日英対訳パターン
Previous: 得られた日英対訳パターン
Jin'ichi Murakami
2006-03-11