表9.8の1つ目の例について,入力文中の語句「信用度 の 高い」に対してベースラインでは誤った訳語「generous」が出力されている一方,+英辞郎では比較的正しい訳語「high credit」が得られている.これについて,学習データ中の日本語単語「信用度」を含む対を調査した.「信用度」を含む対訳学習文中の対を表9.11に,「信用度」を含む英辞郎中の対訳句を表9.12に示す.
日本語側 | 英語側 |
同社 は 、 その サービス の ターゲット を 信用度 の 高い 人 、 つまり クレジットカード による 借金 を すぐ に 払っ て くれる 人 に 置い た 。 | The company targeted its offering to people with good credit , people who usually pay off credit card debt quickly . |
かならず 手形 を 期日 に 支払う ので 彼 の 信用度 は 高い 。 | He never fails to honor his bills and his credit is good . |
日本語側 | 英語側 |
信用度 | credit raking |
本人 の 信用度 | credit worthiness of the subject |
の 信用度 を 評価 する | evaluate one 's credit |
信用度 | credit rating |
信用度 | credit rating |
対訳学習文において「信用度」は表9.11に示す2文のみに出現する低頻度語となっている.NMTでは統計的信頼性の低い低頻度語を含む文や長い文を含む処理においてAttentionの精度が低下するため, 例1ではベースラインの出力文において誤りが生じたと考えられる.
一方で表9.12より,英辞郎において「信用度」を含む対訳句は5対(全て5単語以下)ある上,全ての英語対訳句は比較的正しい訳語「credit」を含んでいることがわかる.したがって,入力文中の単語「信用度」に対して適当な対応をより多く含む英辞郎を用いる手法では推定の精度が向上し,比較的正しい単語「credit」が訳出されたと推察される.