next up previous contents
次へ: 考察 上へ: honron 戻る: 評価   目次

実験結果

本研究では、アンカー英和辞典5,000文、新聞記事5,000文、アンカー英和辞典 20,000文に対して実験を行った。
 ここで、原文データの例としてアンカー英和辞典の一部を以下に示す。

(例12)


英文 日本文
He is a poet and diplomat 彼は詩人でもあり外交官でもある
Tom and Betty are of an age トムとベティーは同い年だ
A dog is a faithful animal 犬は忠実な動物である
I know a man who says so 私はそう言っている人を知っている
He has a knowledge of English   彼は英語を少々知っている


 アンカー英和辞典5,000文に対して実験を行った結果、対応率が50%以上で一 致数が2以上である対訳パターンがプログラムにより93個抽出された。
 93個の中から、「立っていた」のように、パターンではないもの51個を人手で 削除し、42個で評価を行った。「立っていた」は1単語だけなので、パターンで はないと判断し削除した。
 以下に、削除したものの例を示す。

(例13)
立っていた : $ N $ stood there ・・・ 対応率66.7%(2 /3)
平等である : All $ N $ are equal ・・・ 対応率100%(2 /2)
落ちていた : $ N $ was dripping ・・・ 対応率100%(2 /2)

 本研究では、日英対訳パターンの作成を目指しているので、例13のようにほぼ 対訳となっていても、パターンでなければ削除した。

42個に対する評価の結果を表1に示し、完全に対訳であるパターンの例を例14に、 ほぼ対訳であるパターンの例を例15に示す。





表 1: 実験結果(1)
原文データ 評価対象 完全に対訳 ほぼ対訳 対訳ではない 正解率
英和辞典5,000文 42 5 26 11 73.8%(31/42)


(例14)完全に対訳であるパターンの例
$ N $$ N $をとる : $ N $ catch $ N $ ・・・ 対応率50%(2 / 4)
$ N $に会いたい : want to see $ N $ ・・・ 対応率66.7%(2 / 3)
$ N $$ N $に終わった : $ N $ ended in $ N $ ・・・ 対応率66.7%(2 / 3)
$ N $$ N $を信じ : $ N $ believe in $ N $ ・・・ 対応率66.7%(2 / 3)
$ N $に沈んだ : below the $ N $ ・・・ 対応率100%(2 / 2)

(例15)ほぼ対訳であるパターンの例(下線部分が対訳)
$ N $$ N $に沿って : along the $ N $ ・・・ 対応率66.7%(2 / 3)
$ N $を渡った : $ N $ crossed the $ N $ ・・・ 対応率100%(2 / 2)
その$ N $をあきらめた : $ N $ gave up the $ N $ ・・・ 対応率100%(2 / 2)
     
     
     

新聞記事5,000文に対して実験を行った結果、対訳パターンが223個抽出された。 パターンではないもの166個を削除し、57個で評価を行った。その結果を表2に示 し、完全に対訳であるパターンの例を例16に、ほぼ対訳であるパターンの例を例 17に示す。






表 2: 実験結果(2)
原文データ 評価対象 完全に対訳 ほぼ対訳 対訳ではない 正解率
新聞記事5,000文 57 14 24 19 66.7%(38/57)


(例16)完全に対訳であるパターンの例
$ N $に予定される$ N $ : $ N $ scheduled for $ N $ ・・・ 対応率50%(2 / 4)
$ N $に設立した$ N $ : $ N $ established in $ N $ ・・・ 対応率66.7%(2 / 3)
$ N $を取り巻く$ N $は : $ N $ surrounding $ N $ ・・・ 対応率66.7%(2 / 3)
     
     
     

(例17)ほぼ対訳であるパターンの例(下線部分が対訳)
$ N $を発売する : release two $ N $ ・・・ 対応率66.7%(2 / 3)
いわゆる$ N $$ N $ : the so-called $ N $ ・・・ 対応率100%(3 / 3)
$ N $からの$ N $に頼ってきた : relied on $ N $ ・・・ 対応率100%(2 / 2)
     
     
     

アンカー英和辞典20,000文に対して実験を行った結果、対訳パターンが451個抽 出された。パターンではないもの229個を削除し、222個で評価を行った。その結 果を表3に示し、完全に対訳であるパターンの例を例18に、ほぼ対訳であるパター ンの例を例19に示す。






表 3: 実験結果(3)
原文データ 評価対象 完全に対訳 ほぼ対訳 対訳ではない 正解率
英和辞典20,000文 222 47 130 45 79.7%(177/222)


(例18)完全に対訳であるパターンの例
$ N $$ N $に着いた : $ N $ arrived $ N $ ・・・ 対応率50%(5 / 10)
$ N $$ N $と結婚した : $ N $ married $ N $ ・・・ 対応率62.5%(5 / 8)
$ N $$ N $$ N $がある : $ N $ has a $ N $ for $ N $・・・ 対応率50% (3 / 6)
     
     
     

(例19)ほぼ対訳であるパターンの例(下線部分が対訳)
$ N $が好きになった : to like $ N $ ・・・ 対応 率50%(2 / 4)
$ N $$ N $がいい : $ N $ is better ・・・ 対応 率50%(2 / 4)
$ N $$ N $反する : $ N $ is against ・・・ 対応率50%(2 / 4)
     
     
     

 以上の結果のように、文番号の一致数は少なかったが、日英対訳パターンを自 動的に抽出することができた。


next up previous contents
次へ: 考察 上へ: honron 戻る: 評価   目次
平成14年4月17日