next up previous contents
次へ: おわりに 上へ: 考察 戻る: 単語選択の問題点   目次

未知語の問題

本研究では,どちらの学習データを用いた場合でも,出力文の多くは意味を理解 するために必要な単語が翻訳されず,未知語となって出力されていた.特に,重 文複文の翻訳では,テストデータの単語数が多いため,単文と比較して多く未知 語が出力されていた.未知語を含む出力文の例を以下に示す.

   
  未知語の例1
入力文 彼 は ハサミ で 包み を 開い た 。
正解文 He opened a package with a pair of scissors .
出力文 He ハサミ opened in the package .
   

  未知語の例3
入力文 日 の あたら ない 所 に 置け 。
正解文 Put it in the shade .
出力文 あたら not 置け a day .
   

  未知語の例2
入力文 この 金 は いつ 入用 が 有る か わから ない から いつも 手もと に
  置き ます 。
正解文 I keep the money at hand , for I may need it at any moment .
出力文 This 入用 The inhabitants don't know what to 手もと I always from
  any money every other .
   

このことから,より大規模なコーパスを用いて,翻訳実験を行なう必要がある. もしくは,未知語対策が必要であると考えている.



平成20年3月25日