next up previous contents
次へ: 結合価パターン方式の限界を超える問題 上へ: 考察 戻る: 考察   目次

日本語結合価パターンのカバー範囲の問題

実験結果に基づき,日本語結合価パターンに適合した日本語文が,対応する中国語結合価パターンでは正しく翻訳で きない場合について検討する.
ケース1:意味的な制約条件のない名詞変数の問題

日英結合価パターンでは,意味的な制約条件の付与されていない変数がかなり存在す る.これは,日英翻訳では,特定の格要素の 意味属性で英語文型が決定される場合がかなり存在するためである.これに対し て,日英翻訳で意味的な制約を不要とされていた変数 の中にも,日中翻訳では,意味的な制約条件を付与すべき変数が存在する.これは, 日英翻訳と日中翻訳では,訳し分けで重要な要素は同じでないことを示している.

3.3節のC評価の例1はこの例に当たる.この例を用いて,ケース1を説明する.
(パターン番号:302010-00、使う頻度:336回):

パターンの意味属性を表[*]に示す.
表: 「パターン:でる」の意味属性調査表
属性番号 属性意味
* 全ての意味属性
-2671 暦日以外の意味属性

この例では,日本語結合価パターンに対して,意味属性の制約条件により,3つの 中国語結合価パターンを作成できる.作成例を表[*]に示す.

表: 「パターン:でる」に対して作成できる中国語結合価パターン
1.出現: $N1$  出現  "在"   $N2$
2.体現: $N1$  体現  "在"   $N2$
3.出版: $N1$  出版  "在"   $N2$

作成した中国語結合価パターンを用いて,クローズテストでは,良い翻訳品質を 得られた.結果を以下に示す しかし,オープンテストでは,作成した結合価パターンを使用すると,文の愛昧 さが出てくる.結果を以下の結果を示す. ケース1の問題で翻訳に失敗した入力文は,全体の約7%(14/200)に 相当する.この問題を解決するには,現在の日英翻訳用の日本語結合価パターン の変数の意味分類体系をより詳細化する必要がある. ケース2:名詞の意味的な制約条件の粒度の問題

変数に対する意味的な制約条件が付与されている日本語結合価パターンでも,その条件が 甘く,対応する中国語結合価パターンが複数存在する場合が多くある.試作し た結合価パターン辞書では,そのうちの一つしか定義されておらず,誤った訳文が生成される.

3.3節のD評価の例文はこの例に当たる.この例を用いて,ケース2を説明する.
(パターン番号:203739-00、使う頻度:306回):
この例では,日本語結合価パターンに対して,意味属性の制約条件により,2つの 中国語結合価パターンを作成できる.作成例を表[*]に示す.

パターンの意味属性を表[*]に示す.
表: 「パターン:ひどい」の意味属性調査表
属性番号 属性意味
3 主体
2055 出来事
1560 行為
2422 抽象的関係

この例では,日本語結合価パターンに対して,意味属性の制約条件により,4つの 中国語結合価パターンを作成できる.作成例を表[*]に示す.

表: 「パターン:ひどい」に対して作成できる中国語結合価パターン
1.5389害:$N1$   5389害
2.無情:$N1$   無情

作成した中国語結合価パターンを用いて,クローズテストでは,良い翻訳品質を 得られた.結果を以下に示す

しかし,オープンテストでは,作成した結合価パターンを使用すると,文の不適 切さが出てくる.結果を以下の結果を示す.

ケース2の問題で翻訳に失敗した入力文は,全体の約8%(16/200)に 相当する.これらの問題を解決するには,現在の日英翻訳用の日本語結合価パター ンの変数の意味属性の見直しが必要である. ケース3:用言訳語選択の問題

日本語結合価パターンのカバー範囲が広く,複数の中国語結合価パターンが対応するような場 合でも,一つの汎用的な中国語結合価パターンで済ますことのできる場合がある. 例を以下に示す.
日本語結合価パターン:$N1$  が  綺麗
$N1$の意味属性は:
(4人   468自然   534生物   760人工物   1002抽象物   2304自然現象   2564形状)

この例では,日本語の 「綺麗」 に対して,中国語の「美4E3D 」,「好看」,「美89C2」 の3つの述語が意味的に対応する.従って、 これらの意味を訳し分けるには、表[*]のような3つのパターンが必要となる。



表: 「パターン:綺麗」に対して作成できる中国語結合価パターン
1.美4E3D:  N1    美4E3D
2.好看:  N1    好看
3.美89C2:  N1    美89C2

しかし,「好看」,「美89C2」は,それぞれ特殊な意味での「きれいさ」を表すの に対して,「美4E3D 」は,より一般的な意味での「きれいさ」を表す.意味属性から言えば, (4人   468自然   534生物   760人工物   1002抽象物   2304自然現象   2564形状)
上記の意味属性に対して,「美4E3D 」は全て対応できる.しかし,「好看」は (1002  抽象物    2304  自然現象)の部分の体言に対応すれば,不自然さがある.

例えば,(1002抽象物)の恋情と対応すれば,「恋情好看」になると,とても不自然と感 じる.

「美89C2」は(4人   468自然   534生物   1002抽象物   2304自然現象)の部分の 体言に対応すれば,不適切さがある. 例えば,(4人)の父と対応すれば,「父親美89C2」になると,意味を理解できない ほどの不適切さがある.

そこで,日本語結合価パターンには,「美4E3D 」を使用した中国語結合価パターンを対応させれば,意味の正しい中国 語文が作成できる.すなわち,この日本語結合価パターンには,中国語結合価パターン 「1.美4E3D: $N1$ 美4E3D 」を対応させれば,正しい翻訳が可能となる.

実験結果によれば,このようなパターンの改良で正しい翻訳が可能になる 入力文は約3%(6文/200文)である. ケース4:不適切な名詞訳語の問題

入力文に対して適切な構造の中国語の訳文が作成されているときでも,変数部分(名詞)において不適切な訳語が選ばれて いることがある.例を以下に示す.

日本語の名詞「木」は「6811」,「木5934」,「6886子」などという3つの中国語訳語 があり,意味的な用法として,それぞれ 「樹木」,「材木」,「楽器」という意味属性を持つ.そこで,「木」の意味属性が 決まることで,対応する訳語も決定できる.

ただし,変数化された日本語の単語に対して訳語が絞り込めない場合がある. 文献[4]によれば,このような語が日本語単語の全体 の約5%存在する.この問題を解決するには,単語の意味属性体系を中国語単語の意味と整合 するように見直すことが必要と考えられる.


next up previous contents
次へ: 結合価パターン方式の限界を超える問題 上へ: 考察 戻る: 考察   目次
平成18年4月11日