追加した外部辞書と翻訳結果の分析

対訳学習文に英辞郎を追加する手法について,出力文と英辞郎の関係性について調査したところ,8.2節の考察と同様に 追加した対訳句と+英辞郎の出力文に相関性があることが認められた.

9.8の1つ目の例について,入力文中の語句「信用度 の 高い」に対してベースラインでは誤った訳語「generous」が出力されている一方,+英辞郎では比較的正しい訳語「high credit」が得られている.これについて,学習データ中の日本語単語「信用度」を含む対を調査した.「信用度」を含む対訳学習文中の対を表9.11に,「信用度」を含む英辞郎中の対訳句を表9.12に示す.


表: 「信用度」を含む対訳学習文中の対
日本語側 英語側
同社 は 、 その サービス の ターゲット を 信用度 の 高い 人 、 つまり クレジットカード による 借金 を すぐ に 払っ て くれる 人 に 置い た 。 The company targeted its offering to people with good credit , people who usually pay off credit card debt quickly .
かならず 手形 を 期日 に 支払う ので 彼 の 信用度 は 高い 。 He never fails to honor his bills and his credit is good .



表: 「信用度」を含む英辞郎中の対訳句
日本語側 英語側
信用度 credit raking
本人 の 信用度 credit worthiness of the subject
の 信用度 を 評価 する evaluate one 's credit
信用度 credit rating
信用度 credit rating


対訳学習文において「信用度」は表9.11に示す2文のみに出現する低頻度語となっている.NMTでは統計的信頼性の低い低頻度語を含む文や長い文を含む処理においてAttentionの精度が低下するため, 例1ではベースラインの出力文において誤りが生じたと考えられる.

一方で表9.12より,英辞郎において「信用度」を含む対訳句は5対(全て5単語以下)ある上,全ての英語対訳句は比較的正しい訳語「credit」を含んでいることがわかる.したがって,入力文中の単語「信用度」に対して適当な対応をより多く含む英辞郎を用いる手法では推定の精度が向上し,比較的正しい単語「credit」が訳出されたと推察される.