次へ: 文型パターン記述言語
上へ: 文型パターン辞書と文型パターンパーサ
戻る: 文型パターン辞書と文型パターンパーサ
目次
本研究では,文型パターン翻訳方式のための重文・複文文型パターン辞書を扱う.
この文型パターン辞書には,22万件の文型パターンが収録されている.
文型パターン辞書は,15万件の日英対訳コーパスから作成されている.
日英の各対訳文に含まれる線形要素をそれぞれの値域を持つ変数に置き換え,
各種関数・記号を付与することで作成されている.
この辞書には,単語レベル(12万件),句レベル(8万件),節レベル(2万件)
の3つのレベルでそれぞれ汎化された文型パターンが収録されている.
以下に例を示す.
- 原文
- 日本語文:
- 大阪に着くまでの間、ずっと本を読み続けた。
- 英語文:
- I read until I reached Osaka.
- 単語レベル
- 日本語文型パターン
- /y </tk は> /tcfk に /cf ^rentai (まで|迄) の ! 間、 <! は> #5[! ずっと] /tck 本を /cf (つづけ|続け) た。
- 英語文型パターン
- <I|> ^past until <I|> ^past .
- 句レベル
- 日本語文型パターン
- /y </tk は> ! ^rentai (まで|迄) の ! 間、 <! は> #4[! ずっと] /tck 本を /cf (つづけ|続け) た。
- 英語文型パターン
- <I|> ^past until <I|> ^past.
- 節レベル
- 日本語文型パターン
- /y /tcfk ^rentai (まで|迄) の ! 間、 ! .kako 。
- 英語文型パターン
- ^past until ^past.
本研究では,単語レベルの文型パターンを対象として用いる.
日英文型パターン翻訳方式では,入力文に適合する日本語文型パターンを検索し,
対応する英語文型パターンを用いて訳文を生成する.
Subsections
平成19年3月1日