next up previous contents
次へ: 文長差によるフィルタリング 上へ: 文長差を用いた翻訳文の選択 戻る: 文長差を用いた翻訳文の選択   目次


単文データセットにおける文長差の調査

まず,日英の文長差がいくらであれば適切であるかを調査する.本研究で用いる単文コーパス181,988文において各文長差の文数をカウントした.結果を表4.6.3.1に示す. 表において,単語数の差は日本語の単語数を基準としている(+2→日本語の方が2単語多い).
表: 文長差の統計
文長差 文数
-3 4,400
-2 8,308
-1 15,027
0 23,711
1 29,694
2 30,464
3 24,974
4 17,150
5 9,885
6 5,339
7 2,682

結果より,単文においては0〜+4の文長差が比較的多数であることが確認できた.



平成25年2月12日