次へ: 翻訳の様子
上へ: 格要素パターン辞書を用いた機械翻訳
戻る: 文パターンの拡張
目次
翻訳方法
図4.2を参照しながら,日英翻訳の手順を説明する.
- 日本語の入力文に対して形態素解析した後に,照合器SPMにより日文パ
ターンと照合を行う.
それにより適合した情報が「適合パターン情報 1 」で
ある.これは,入力文に対する形態素解析情報,それに適合した日文パ
ターン情報と変数情報,および,英文パターンで構成する.
- (1) で日文パターンの任意格要素部分である変数に適合した格要素が
ある場合,格要素パターン辞書の格助詞パターンと照
合し,ここでも変数の意味属性制約を検査する.この結果(適合した格
要素パターン,それに対応する前置詞句パターン,および,変数の情報)
を(1) の出力に付与したものが「適合パターン情報 2 」であ
る.
- (1) の英文パターンに,(2) の前置詞句パターンを付与する.このとき
の前置詞句パターンで,格要素パターン辞書作成時に,抽出元となった
英文パターンの先頭で使われていたものは (1) の英文パターンの先頭に,
それ以外で使われていたものは後方にそれぞれ付与する.
それらの判断は前置詞句パターンの先頭が大文字か小文字で行う.なお,
英文パターンで入力文に対して必要のない前置詞句部分は削除する.
- (3) によって作られた英文パターンの変数に対応する日本語を翻訳器ITM
により日英単語翻訳する.
ここで,変数は名詞や形容詞であるので,単なる辞書引きで実現でき
る.このとき,複数の候補がある場合,全てを翻訳候補として登録する.
- 入力文に対する複数の翻訳候補(パターンと英単語の両方に曖昧性があ
る)に対して,英単語のtri-gramで文のスコアを算出する.
このスコアが最も高いものを出力とする.
平成22年2月11日