next up previous contents
Next: 作成された文型パターンの例 Up: 文型数の調査 Previous: 文型数の調査   Contents

文型の削減率の調査

変数化によって得られた文型パターンにおいて日本語パターンの異なり数を調査 し,重複する日本語パターンを削減した.ここで,総文数に対して削減された文数 の割合を削減率とする.表8に,日英対訳文数に対する品詞ごとの変数化後のパターンの削減率を示す.表8より,名詞の変数化によるパターンの削減率が高いことがわかる.また,体言(名詞,固有名詞,副詞,連体詞,代名詞)を変数化した場合は,削減率が4.73%であったが,用言(形容詞,動詞)を変数化することで6.36%に上がった.

Table 8: 重複するパターンの削減率
品詞 総文数[件] 削減後の文数[件] 削減率[%]
名詞のみ 215,242 206,246 4.27
固有名詞のみ 215,242 209,980 2.54
副詞のみ 215,242 210,037 2.51
連体詞のみ 215,242 210,042 2.51
代名詞のみ 215,242 209,511 2.66
体言 215,242 205,257 4.73
形容詞のみ 215,242 209,840 2.51
動詞のみ 215,242 209,969 2.54
すべての品詞 215,242 201,754 6.36



Jin'ichi Murakami 2006-03-11