次へ: 意訳とは
上へ: 重文・複文文型パターン辞書による意訳の可能性 The feasibility of
戻る: はじめに
ITM は,文型パターン辞書の照合結果より半自動で日英翻訳を行うツールである.
文型パターン辞書は,単語,句,節の3つのレベルで分類された約22.7万件の日英文型パターン対で構成されている[1].
日本語文と文型パターン辞書の照合は,パターン検索プログラムにより実行される[3].
パターン検索の結果として,適合する全てのパターンが得られるので,
人手で,翻訳に使用する日英パターン対,および,適合状態を指定すると,ITM がそれらを用いて英文を生成する[2].
なお,本稿では,文型パターン辞書から,単語レベル,句レベル,節レベルの順にパターンを参照し,
最初に適合したレベルの結果を使用する.
以下に入力文,日英文型パターン対,および,訳出文の例を示す.
|
入力文 |
人は年をとると大人になる。 |
|
(単)日パ |
/ytcfk
は/tcfk年を/cf(取る
とる)と/tck(大人
おとな)に/cf(成る
なる)。 |
|
(単)英パ |
As
grow older,
will grow in moderation. |
|
(句)日パ |
/ytcfk
は
と
。 |
|
(句)英パ |
As
,
will
. |
|
(節)日パ |
/ytcfk
と/tck
。 |
|
(節)英パ |
As
,
. |
|
訳出文 |
As you grow older, it will grow in moderation. |
,
,
は,それぞれ名詞,動詞句,節の変数である.
これらは,線形要素と呼ばれる部分であるので,
変数に対応する日本語表現を局所的に翻訳した結果を,
英語パターンの対応箇所に挿入することができる.
/ytcfk や /cf などは,離散記号である.
各離散記号と適合する日本語要素の詳細を表
に示す.
現在のITMには未実装だが,離散記号処理機能が稼働すれば離散記号に適合する
部分の訳出が可能となる.
例えば,格要素に適合する記号 /c が「〜で」という日本語表現に適合した場合
に,「by 〜」,「in 〜」等の知識を用いて訳出する.
これらは[1]の辞書における対訳の関係から抽出できる.
表:
各離散記号と適合する日本語要素
/y |
連用節と適合 |
/t |
連体節と適合 |
/c |
格要素と適合 |
/f |
連用修飾要素と適合 |
/k |
連体修飾要素と適合 |
次へ: 意訳とは
上へ: 重文・複文文型パターン辞書による意訳の可能性 The feasibility of
戻る: はじめに
平成20年1月27日