next up previous contents
Next: 結論 Up: No Title Previous: 実験結果

考察

ALT-J/Eの英訳文で評価『×』となった123件の例文について、 正しい訳語を導き出せなかった原因を調べた結果表3のようになった。 原因調査は、ALT-J/Eが英訳文を導き出すまでの形態素解析結果、 係り受け解析結果、結合価文法辞書を参考に行った。 以下に原因を述べる。


 
Table 4: 間違った訳を導き出した原因
  原因 割合

1

結合価パターンが登録されていない場合 20% 25/123
2 結合価パターンが登録されているが使えなかった場合 34% 42/123
3 例文に慣用表現が用いられている場合 11% 13/123
4 形態素解析に失敗した場合 11% 14/123
5 係り受け解析に失敗した場合 17% 21/123
6 訳の時制がおかしい場合 2% 2/123
7 例文が二通りの意味にとれる場合 5% 6/123

   

1.
結合価パターンが未登録の場合 (20% 25/123)

例1:岡っ引きが盗人を縄で縛めた。

ALT-J/Eの訳1:The detective adomonished a thief with rope.

対訳1:The detective tied up the thief with rope.

例2:彼女は心痛のあまり病を得た。

ALT-J/Eの訳2:She feel sick.

対訳2:She became sick bacause of distress.

例1では動詞『縛める(いましめる)』についてパターンが登録されてなく、 同じよみの『戒める』のパターン「N1(人)がN2(人)をN3(動作)と戒める N1 adominish N2 N3」が適用されている。 また例2では『得る』という動詞から『fell (sick)』という訳語が 出力されるパターンは登録されていないので、例文中の『病』 から『fell (sick)』という訳がでたと思われる。 この問題は正しい訳語が得られなかった例文に対するパターン、例1では 「N1(人)がN2(人)を縛める N1 tie up N2」というようなものを 結合価パターンに登録すれば解決されると思われる。

2.
結合価パターンが登録されているがうまく使えなかった場合(34% 42/123) 結合価パターンがうまく使えない原因は二つある。
(a)
動詞に係る名詞が訳されなかった場合(10件)

例3:彼はフグに当たった。

ALT-J/Eの訳3:He consalted フグ.

対訳3:He was poisoned by a puffer fish.

例3の文はパターン「N1(人)がN2(魚介、食料)に当たる N1 be poisoned by N2」を適用させれれば、正しい訳文が導き出される。 しかし動詞の『当たる』に係っていく名詞の『フグ』が、ALT-J/Eの辞書に 登録されていないので、N2に相当する名詞の意味属性が判定できずに、 結合価パターンをうまく適用できなかった。この場合は登録されていなかった 名詞を登録すれば解決されると思われる。

(b)
登録してあるパターンと文の構造や助詞が異なる場合(32件)

例4:彼は海外で夏休みを送った。

ALT-J/Eの訳4:He saw a summer vacation off at a foreign country.

対訳4:He spent his summer vacation abord.

例4に対しては「N1(人)がN2(時間、休暇)を送る N1 spend N2」 というパターンを適用させれれば、正しい訳文が導き出される。 例4に似た文で『彼は夏休みを送った。』という文を ALT-J/Eで翻訳した場合、正しい訳文が得られた。 しかし実際には「N1(主体)がN2(主体)をN3(場所、場、建造物)で送る N1 see N2 off at/in N3」のパターンが使われている。 原因は例文の『海外で』という節に影響されたからと考えられる。 これはALT-J/Eのシステム上の問題であると思われる。

3.
例文に慣用表現が用いられている場合 (11% 13/123)

例5:あの作家が筆を折ってから二十年にもなる。

ALT-J/Eの訳5:After that writer breaks a brush, it also come in 1945.

対訳5:It has been twenty years since the writer gave up writing.

例5の文に対して「N1(人、具体物、気象)がN2(具体物)を折る N1 break N2」というパターンがあてはまる。しかし例4『折る』の訳に対して 『break』は適当ではない。よって慣用表現に対しては多くの例を集め、 それぞれ個別に意味属性を用いずに登録する必要がある。 例5の場合では「N1(人)が筆を折る N1 give up writting」というような パターンを登録することにより正しい訳語が導き出されると思われる。

4.
形態素解析に失敗した場合 (11% 14/123)

形態素解析とは文を単語単位に分け、それぞれの品詞などを解析する作業である。 つまり形態素解析に失敗すれば、いくら結合価パターンを登録していても 役に立たない。

例6:近年少年犯罪は増加の傾向にある。
ALT-J/Eの訳6:近 年少 年 犯罪 increases.
対訳6:Juvenile crime is on the increase.

5.
係り受け解析に失敗した場合 (17% 21/123)

係り受け解析ではそれぞれの文節の関係を解析する作業である。 結合価文法は、動詞を中心に動詞に係る格要素の関係を記述したものなので、 係り受け解析を失敗すると役に立たない。

6.
英訳文の時制がおかしい場合 (2% 2/123)

例7:僕は明日は雨だと思う。

ALT-J/Eの訳7:I will think tommorow that is rain.

対訳7:I think it will rain tommorow.

4、5、6の場合は結合価文法とは別の問題である。これらの問題が解決され 正しく処理されたとき、結合価文法は効果を発揮し、正しい訳語を 導き出すと思われる。

7.
例文が二通りの意味に取れる場合(5% 6/123)

例8:本屋は新刊本を入れた。

ALT-J/Eの訳8:The bookseller pawned a newly published book.

対訳8:The book shop reseived the new publications.

例7の文は「本屋が新刊本を入荷した」という意味だが、極解すれば 「本屋の人が新刊本を質入れした」という意味にもとれる。 よって「N1(主体)がN2(具体物)を入れる」というパターンに対して、 『reseive』と『pawn』の二つの訳語が必要になる。そのため 結合価文法だけでは訳し分けが不可能である。


next up previous contents
Next: 結論 Up: No Title Previous: 実験結果

2001-03-23