next up previous contents
次へ: 文生成 上へ: パターン翻訳システム 戻る: 表現解析   目次

文パターンの選択

日本語入力文の形態素解析結果と日本語文パターンの照合を行い,適合した日本語文パターンの抽出を行う.照合には検索ツール[8]を用いる. ここで,英語翻訳文の全体的な構造は英語文パターンにより決定できる.英語文パターンは日本語入力文と適合した日本語文パターンにより決まる.そこで日本語入力文に適切に適合する日本語文パターンの選択を行う必要がある.選択手法には多変量解析を用いる手法などがあるが,[1]では人手により文パターンの選択を行っている. 適合した対訳文パターンの例を表2.5に示す.


表: 適合した対訳文パターンの例
日本語入力文 雨の中に立って彼を待った。
日本語文パターン $ <N1$$ >$ $ N2$ の中に立って $ N3$$ V4.kako$
英語文パターン $ <$ I $ \vert$ $ N1>$ $ V4 \verb\vert^\vert past$ for $ N3 \verb\vert^\vert obj$ standing in $ N2$ .

英語文の部分的構造は英語文パターンの記号と変数および関数で定義されている.記号は日本語入力文と日本語文パターンの照合結果により処理が決まる.記号は構造上の線形性を記述するために使用される.英語文パターンで使用される記号を表2.6に示す.記号を分類すると(1)OR条件による線形要素の適合範囲拡大のための記号,(2)線形要素の挿入や省略のための記号に分類できる.


表: 英語文パターンで使用される記号
分類 記号名 書式 説明
(1) 要素選択 (パターン記述1$ \vert$ 複数記述された要素のいずれか
  記号 パターン記述2$ \vert\cdots$ ) を使用
  対応型要素 #数(パターン記述1$ \vert$ 日英方向の要素の対応関係を
  選択記号 パターン記述2$ \vert\cdots$ ) 保ったまま対応する順序で日英方向
      の要素を指定
  訳出要素 #数$ <$ パターン記述1$ \vert$ 日本語文パターンで左側のパターン
  選択記号 パターン記述2$ >$ 記述に対応する要素が適合しなかった
      場合,右側のパターン記述を使用
  標準形 `用言の標準形' 字面部分の標準形を指定
  表現記号    
(2) 任意要素 #数[$ \cdots$ ] 日本語文パターンで適合する要素
  記号   がある場合のみ訳出対象
  要素挿入 #数{挿入要素} 英語側の要素の中に副詞等の
  記号   別の要素を挿入し訳出

変数には表2.7の変数を用いる.


表: 英語文パターンで使用される変数
分類 変数 説明 分類 変数 説明
単語 $ N$ 名詞または名詞複合語 $ NP$ 名詞句
  $ TIME$ 時詞   $ VP$ 動詞句
  $ NUM$ 数詞   $ AJP$ 形容詞句
  $ ND$ 用言性名詞   $ AJVP$ 形容動詞句
  $ V$ 動詞   $ ADVP$ 副詞句
  $ AJ$ 形容詞 $ CL$
  $ AJV$ 形容動詞 その他 $ ANY$ 直接引用で
  $ ADV$ 副詞     使用され,
  $ REN$ 連体詞     どの要素も
  $ GEN$ 限定詞     使用可

英語文パターンの記述子は表2.7の変数および関数である.関数は制約の機能を持ち,先行する記述子に制約を与え,変数のみによる制約よりも厳しい絞り込みが可能である. 英語文パターンで使用される関数を表2.8に示す.


表: 英語文パターンで使用される関数
分類 関数 説明
名詞制約 $ \verb\vert^\vert obj$ $ \verb\vert^\vert poss$ $ \verb\vert^\vert pron$ 目的格,所有格,代名詞
  $ \verb\vert^\vert adposs$ $ \verb\vert^\vert reflex$ 独立所有格,再帰代名詞
動詞制約 $ \verb\vert^\vert base$ $ \verb\vert^\vert past$ $ \verb\vert^\vert ing$ 原形,過去形,現在分詞形
  $ \verb\vert^\vert present$ $ \verb\vert^\vert ed$ 現在形,過去分詞形
形容詞制約 $ \verb\vert^\vert er$$ verb\vert^\vert st$ 比較級,最上級


next up previous contents
次へ: 文生成 上へ: パターン翻訳システム 戻る: 表現解析   目次
平成27年3月13日