Next: 翻訳精度の調査
Up: 得られた日英対訳パターン
Previous: 変数化された単語
変数化によって得られた文型パターンにおいて日本語パターンの異なり数を調査
し,重複する日本語パターンを削減した.表4に,日英対訳文数に対す
る品詞ごとの変数化後のパターンの削減率を示す.表4より,名詞の変
数化によるパターンの削減率が高いことがわかる.また,体言(名詞,固有名詞,副
詞,連体詞,代名詞)を変数化した場合は,削減率が4.73%であったが,用言(形容詞,
動詞)を変数化することで6.36%になった.
Table 4:
重複するパターンの削減率
品詞 |
総文数[件] |
削減後の文数[件] |
削減率[%] |
名詞のみ |
215,242 |
206,246 |
4.27 |
固有名詞のみ |
215,242 |
209,980 |
2.54 |
副詞のみ |
215,242 |
210,037 |
2.51 |
連体詞のみ |
215,242 |
210,042 |
2.51 |
代名詞のみ |
215,242 |
209,511 |
2.66 |
体言 |
215,242 |
205,257 |
4.73 |
形容詞のみ |
215,242 |
209,840 |
2.51 |
動詞のみ |
215,242 |
209,969 |
2.54 |
すべての品詞 |
215,242 |
201,754 |
6.36 |
実験の結果,日本語パターンにおいて重複するパターンを削減して
も,削減率が7%に満たないことが示された.
Next: 翻訳精度の調査
Up: 得られた日英対訳パターン
Previous: 変数化された単語
Jin'ichi Murakami
2006-03-11