次へ: 補語の削除
上へ: 翻訳用知識ベース(結合価パターンの変形)
戻る: 翻訳用知識ベース(結合価パターンの変形)
目次
結合価パターンは,それぞれ一文で表される.本研究では,文ではなく動詞
句を扱うため,文中の主語に該当する部分の削除を行う.基本となる結合価パ
ターンを変形した例を以下に示す.
(変更前): use as
(変更後):use as
例のように,通常,パターンは名詞変数から始まり(14819パターン中14694パ
ターン),それが主語になっているものが多い.で始まっていないもの
(残り125パターン)でも,規則があるものがある.そこで,主語を除くアル
ゴリズムを以下のように定めた.
- 名詞変数から始まるもののうち,が所有格でないもの
名詞変数部分のみを消去する.
例)
元パターン: become
主語を除いたパターン:become
- 名詞変数から始まるもののうち,が所有格のもの
所有格の後ろには必ず名詞がきているはずなので,名詞変数とそ
の次の変数を消去する.
例)
元パターン:'s eyes meet
主語を除いたパターン:meet
- a,またはanから始まるもの(7パターン)
aやanの後ろには必ず名詞がきている.なので,aまたはanとその
次の変数を消去する.
例)
元パターン:a fire break out in
主語を除いたパターン:break out in
- peopleで始まるもの(6パターン)
6パターンを見てみると,全て,まず最初に現れる名詞変数の後
に主動詞がきていた.そこで,最初に現れる名詞変数以前の単語
を全て消去する.
例)
元パターン:people in be coldhearted
主語を除いたパターン:be coldhearted
- it,またはthere,またはweで始まるパターン(78パターン)
この3つはこれら自身が主語になっていて,次に動詞がきている.
なので,これら自身を消去する.
例)
元パターン:it be a long time since
主語を除いたパターン:be a long time since
これにより,99%以上(14785パターン),うまく主語を除くことがで
きた.また,今後,過去形,三人称単数の``s''などに対応できるように,主
動詞に形態素調整用のマークを付与する.主語を除いた後,パターンの先頭に
マークを付けるようにしてあるので,14785パターンを除く残り34パターンだ
け,マーク付けがうまくいってないことになる.
平成17年4月14日