本論文では用いるNMTの特性上従来の形で未知語が出力されない.
従って本研究での未知語を再定義する.
NMTでは対訳文により学習をしている.
しかし,対訳文の数は有限であるため,入力文のなかに対訳学習文にない単語を含む可能性が高い.
入力文にあって対訳学習文にない単語のことを未知語とする.
未知語を含む文を翻訳する際,以下のような出力がされる.
Table 3.2.1:
本論文の未知語例
入力文 |
「 コノサー 」 誌 の 編集 者 で ある 。 |
出力文 |
He is the editor of the Newsweek magazine . |