next up previous
次へ: 節レベルの文型パターン化の方法 上へ: 文型パターン化の具体的方法 戻る: 各種加工

句レベルの文型パターン化の方法

句レベルの文型パターン化では,「句の変数化」,「現在形変換」,「丁寧表現の標準化」,「名詞から名詞句への拡張」,「動詞から動詞句への拡張」,「機能語の拡充」の6種類の汎化作業を行う.

<例>
名詞句変数と動詞句変数を使用した例を示す。

(1) 3塁の不安定な守備そのチームのアキレス腱だ。 → $NP1$$NP2.da$

The uncertain fielding of the third baseman is the Achilles's heel of that team. → $NP1$ is $NP2$.

(2) あの役人は地位を悪用して金を儲けた。 → $NP1$は/$N2$を/$V3.site$ $VP4$

   $NP1$  $N2$  $V3$  $VP4$

That government official earned money by abusing his position.

    $NP1$      $VP4$     $V3$   $N2$

 →  $NP1$ $VP4.past$ by $V3.ing$ $NP1.pron.poss$ $N2$

(注)$NP1.pron.poss$$NP1$の代名詞の所有格を意味する。

(1)
句の変数化

 変数化する句は線形な「名詞句」,「動詞句」,「形容詞句」,「形容動詞句」,「副詞句」である.以下,それぞれ変数化する句の範囲を示す.

<名詞句の変数化>

 格助詞と名詞の連鎖した表現を名詞句変数化の対象とする.また,動詞,形容詞などの単独用言の連体形により修飾された名詞の表現では,英語側に意味的に対応する部分があるものについて,修飾語と名詞の範囲を名詞句変数化の対象とする.それ以外の名詞句は変数化の対象としない.1つ以上の格要素を持つ用言によって修飾された名詞の表現は名詞句とはせず,「動詞句(形容詞句)+名詞」と解釈する.

 なお,名詞句の変数化では,以下に示すように形容詞の部分や一部の字面や単語変数として残し,残りの部分を変数化しても良い.

<動詞句の変数化>

 主格(が格,は格)を除く1つ以上の格要素を伴った用言について,動詞とその配下にある格要素すべての範囲の表現を動詞句変数化の対象とする.なお,主格を含む場合は,格要素と動詞を含む全体を節と解釈する.

<その他の句の変数化>

 形容詞句,形容動詞句の変数化は,動詞句の場合に準じる.また,副詞句の場合は,名詞句の場合に準じる.

(2)
丁寧表現の標準化

 英語文型パターンに影響のないことを確認して,日本語文型パターンの丁寧表現をフラットな表現に変更する.例えば,「〜する($V$),〜します($V$ます)」,「〜しない($V.not$),〜しません」では,いずれも前者に縮退させる.

(3)
名詞から名詞句への拡張

 修飾部を持たない名詞変数$N$のうち,句に書き換えて良いものを選び$NP$に書き換える.また,「$AJ1$ $N2$」や「$N1$$N2$」等のように連体修飾部を持つ名詞は,全体を$NP$に置き換える.後者の置き換えでは,パターン任意要素として任意化された助詞結合型名詞句の主名詞を除く部分や連体詞,単独形容詞の連体形,単独動詞の連用形を含む名詞はすべて$NP$に置き換える.

(4)
動詞から動詞句への拡張

 以下の条件に従って,動詞変数$V$もしくは動詞句を動詞句変数$VP$に置き換える.

(i)
英語側の主語に対応しない格要素を1つ以上を持つ動詞句であること.
(ii)
英語側の該当する表現に主語がないこと(英語側に主語のある表現では,既に単語レベルで日本語文型パターンの任意要素として,主語が補われている).
(iii)
英語側も対応する句変数が使用されること(関数引数として使用されても良い).
(iv)
なお,日英の該当する動詞とそれを修飾するすべての格要素をまとめて一つの句変数に汎化すること.すなわち該当する格要素の一部を残してはいけない.

 具体的な手順は以下の通りである.まず,修飾部を持たない動詞変数$V$のうち,句に書き換えて良いものを選び,$VP$に書き換える.格要素や副詞に修飾された動詞の場合は,英語側の文型パターンとの対応関係を明示しなければならない要素部分を除き$VP$に置き換える.また,すでにパターン任意要素に指定されている副詞,単独形容詞の連用形,単独動詞の連用形は,修飾先の動詞と共に$VP$に書き換える.

 なお,時制,相と様相に関する関数は削除しない.複合動詞も単語レベルでの汎化のままとする[*]

(5)
機能語の拡充

 ここまでに得られた文型パターン対の日本語文型パターン側を対象に,(i)格助詞,格助詞相当語の部分と(ii)述部の語尾表現で置き換え可能な単語もしくは連語を考えて,要素選択記号($α$$β$|・・・)の形式のパターンとする.追加する単語,連語は,パターン全体の意味を変えないもので,通常よく使われる範囲の語でよい.



平成16年8月30日