next up previous
Next: 翻訳精度の調査 Up: 得られた日英対訳パターン Previous: 変数化された単語

文型数の調査


変数化によって得られた文型パターンにおいて日本語パターンの異なり数を調査 し,重複する日本語パターンを削減した.表4に,日英対訳文数に対す る品詞ごとの変数化後のパターンの削減率を示す.表4より,名詞の変 数化によるパターンの削減率が高いことがわかる.また,体言(名詞,固有名詞,副 詞,連体詞,代名詞)を変数化した場合は,削減率が4.73%であったが,用言(形容詞, 動詞)を変数化することで6.36%になった.




Table 4: 重複するパターンの削減率
品詞 総文数[件] 削減後の文数[件] 削減率[%]
名詞のみ 215,242 206,246 4.27
固有名詞のみ 215,242 209,980 2.54
副詞のみ 215,242 210,037 2.51
連体詞のみ 215,242 210,042 2.51
代名詞のみ 215,242 209,511 2.66
体言 215,242 205,257 4.73
形容詞のみ 215,242 209,840 2.51
動詞のみ 215,242 209,969 2.54
すべての品詞 215,242 201,754 6.36



実験の結果,日本語パターンにおいて重複するパターンを削減して も,削減率が7%に満たないことが示された.

next up previous
Next: 翻訳精度の調査 Up: 得られた日英対訳パターン Previous: 変数化された単語
Jin'ichi Murakami 2006-03-11