本論文の未知語

本論文では用いるNMTの特性上従来の形で未知語が出力されない. 従って本研究での未知語を再定義する.

NMTでは対訳文により学習をしている. しかし,対訳文の数は有限であるため,入力文のなかに対訳学習文にない単語を含む可能性が高い. 入力文にあって対訳学習文にない単語のことを未知語とする. 未知語を含む文を翻訳する際,以下のような出力がされる.

Table 3.2.1: 本論文の未知語例
入力文 「 コノサー 」 誌 の 編集 者 で ある 。
出力文 He is the editor of the Newsweek magazine .