*の追加

本実験では結果として未知語を学習する際でも対訳文で追加が最も良い手法であるという結論になった. そこで単語や句も文のように学習させるためにどうすればよいかを考えた. 以下に例を載せる.

Table 8.1.1: 追加対訳例
* コノサー * * connoisseur *
コノサー * * connoisseur

実際には,下の表の"未知語 *"と"* 未知語"に関しては対訳学習文内にある単語のある数だけ追加している. これは"AがBならばCはD"という形で学習をさせている. そのため例では,"コノサーが*ならば*はconnoisseur"という学習をさせたと考えている. *はどんな単語にもなる可能性がある.以下に実験結果を載せる. 提案手法が*を追加してない結果で、提案手法*が追加した結果である。

ベローナ-Verona

日本語対訳:ベローナ という 都市

英語対訳:a city of Verona

入力文:この 物語 の 舞台 は 15 世紀 の ベローナ で ある 。

参照文:The setting of this story is Verona in the 15th century .

提案手法:The story of this story is fifteen century .

提案手法*:The locale of this story is a success of the fifteenth century .

ベースライン:The stage of this story is a boon to the fifteenth century . オードブル-hors-d'oeuvres

日本語対訳:オードブル から デザート まで 全て 食べ る

英語対訳:eat everything from hors-d'oeuvres to dessert

入力文:その 食事 は オードブル で 始まった 。

参照文:The meal opened with hors-d'oeuvres .

提案手法:The meal began in fermentation .

提案手法*:The meal began with a scythe .

ベースライン:The meal began with a clink .

ザルツブルク-Salzburg

日本語対訳:ザルツブルク 市街 の 歴史 地区

英語対訳:historic center of the city of Salzburg

入力文:ザルツブルク は モーツァルト の 生地 で ある 。

参照文:Salzburg was Mozart's birthplace .

提案手法:Sectarianism is a Mozart of Mozart material .

提案手法*:Sasaki-san is the poetry of Mozart" .

ベースライン:Lobster is a Mozart of Mozart .

実験結果としては,追加してない時とそれほど差が見られなかった. 逆に単語で追加した結果では翻訳性能が下がっていた.