next up previous
次へ: 文型パターン化の具体的方法 上へ: 文型パターン化の原則と方針 戻る: 文型パターン化の原則

文型パターン化の個別的方針

文型パターン化における個別的な方針を示す.

(1)
作業自動化の可能性の追求

膨大な対訳例文から文型パターンを能率良く生成するため,対訳例文の形態素解析と構文解析情報を使用し[*],文型パターン作成の半自動化を目指す.そのため,機械的な変数化と関数化ができるよう,文型パターン作成に先立って元となる対訳標本文は形態素解析し,解析誤りは人手で修正しておくこととする[*]

(2)
文型パターン照合の容易性

従来の構文解析では解消困難な構文多義の問題を解決することも文型パターン翻訳方式の目標の一つである.そこで,入力文と文型パターンの照合では構文解析は使用せず,入力文の形態素解析結果を使用することとし,文型パターンは入力文の形態素解析結果との照合において曖昧さの発生しない方法で記述する.これに伴い,形態素解析で文法的,意味的に解釈の確定しない表現要素については文法的,意味的な指定は行わず,字面もしくは字面の指定される関数を用いて文型パターンを記述するものとする.

(3)
変数書き換えによる文型パターンの汎化

句レベルの文型パターン化では,対訳標本文中の線形な句(既に単語変数化された表現を含んでも良い)を変数化するが,より汎化の範囲を拡大するため,単語レベルで変数化した単語変数についても句変数に置き換え可能なものを探して句変数化する.例えば,名詞を表す単語変数$N$を名詞句変数$NP$に置き換えることができれば,より適用範囲の広い文型パターンが生成できたことになる.

(4)
離散記号による文型パターンの汎化

原文任意要素の定義から分かるように,機械翻訳で使用される文型パターンは,パターン要素のすべてが入力文に含まれていることが条件となるが,逆に入力文には,文型パターンに定義されない要素を含むことも認められる.

そこで,文型パターンがより多くの範囲の入力文に適合するようにするため,入力文と文型パターンの照合を制御するための離散記号を使用し[*],可能な限りこの記号を使用した文型パターン化を行う.

(5)
字面レベルでの表記の揺れの吸収

日本語は表記の揺れが多く,このことが,文型パターンとの照合で大きな問題となる.この問題を解決するため,入力文と文型パターンとの照合の段階で形態素解析プログラムの持つ標準表記認定機能を利用することを前提に,原則として標準表記を用いた文型パターン記述を行うこととするが,同時に,格助詞,助動詞,副詞(いずれも相当語を含む)等について,可能な限り標準表記と異表記の関係をまとめた表を準備し,字面グループを指定する関数や選択記号を使用して使用可能な表記を指定する.



平成16年8月30日