Next: 作成された文型パターンの例
Up: 文型数の調査
Previous: 文型数の調査
Contents
変数化によって得られた文型パターンにおいて日本語パターンの異なり数を調査
し,重複する日本語パターンを削減した.ここで,総文数に対して削減された文数
の割合を削減率とする.表8に,日英対訳文数に対する品詞ごとの変数化後のパターンの削減率を示す.表8より,名詞の変数化によるパターンの削減率が高いことがわかる.また,体言(名詞,固有名詞,副詞,連体詞,代名詞)を変数化した場合は,削減率が4.73%であったが,用言(形容詞,動詞)を変数化することで6.36%に上がった.
Table 8:
重複するパターンの削減率
品詞 |
総文数[件] |
削減後の文数[件] |
削減率[%] |
名詞のみ |
215,242 |
206,246 |
4.27 |
固有名詞のみ |
215,242 |
209,980 |
2.54 |
副詞のみ |
215,242 |
210,037 |
2.51 |
連体詞のみ |
215,242 |
210,042 |
2.51 |
代名詞のみ |
215,242 |
209,511 |
2.66 |
体言 |
215,242 |
205,257 |
4.73 |
形容詞のみ |
215,242 |
209,840 |
2.51 |
動詞のみ |
215,242 |
209,969 |
2.54 |
すべての品詞 |
215,242 |
201,754 |
6.36 |
Jin'ichi Murakami
2006-03-11