next up previous contents
Next: モノリンガルコーパスの利用 Up: 変換テーブル数 Previous: 英語選択   目次

日本語選択

日本語文では句の前後に「の」,「は」,「を」のような助詞が存在する. 日本語選択においても, 前後の単語が合致した際の前後の組み合わせは助詞の組み合わせが多くみられた.

5.1の変換テーブルを表5.3のコーパスを利用して英語選択を行なう例を考える. A である「サッカー」の前後の単語は表5.2の日本語文 (1)より「は」・「を」である. C である「野球」の前後の単語は日本語文 (2)より「は」・「を」である. よって, 日本語選択では表5.1の変換テーブルは AC の前後の単語が合致することにより削除されない.





表: 日本語コーパス文の例
日本語文 (1) 私 は サッカー を する 。
日本語文 (2) 彼 は 野球 を する 。




よって, 日本語文の句の前後に助詞が存在することが日本語選択において最も多く変換テーブル数が残った原因である.



2020-03-11