next up previous
次へ: 表現構造とクラスの記述 上へ: 構造規則の記述方法 戻る: 構造規則の記述方法

構造規則の基本型

自然言語処理において発生する解釈の曖昧さの種類はさまざまである.それ を解消するために必要な情報も,文脈情報や常識,世界知識や専門知識などさま ざまで,すべての種類の曖昧さを解決できるような情報をあらかじめ網羅的に準 備することは困難である.

ここで,従来の自然言語処理を見ると,表現の構造に関する知識は,文法知識 として意味から分離し,表現の意味は,文法規則に従って語彙情報から合成する 方法が一般的であった.しかし,実際の自然言語では,表現の構造とその意味を 一体化して扱うことの必要な場合も多い.従来の言語解析で発生する解釈の曖昧 さの多くは,むしろ,このような構造と意味に関する知識をあらかじめ準備する ことによって解決できる可能性がある.そこで,本論文では,このような知識を 「構造規則」として,その形式を定義し,収集する方法を考える.

さて,このような「構造規則」は,一般に,表現構造を定義する部分とその解 釈を定義する部分から構成できる.このうち,言語表現の構造を記述する方法と しては,木構造,リスト構造,意味ネットワークなど様々な方法がある.言語表 現の構造的,意味的多義について考えると,文字列や品詞の並びから見た限りで は,類似または同等と思われるような表現が,統語的もしくは意味的に複数の解 釈を持つことが問題である.そこで,対象とする表現構造を,言語表現そのもの に近く,理解しやすい表現として,文字もしくは記号の連鎖からなる一次元的な パターンとして表現する.すなわち,構造規則の対象とする表現は,キーとなる 文字列部分(「固定部」と称す)と形式的に他の単語や表現に置き換えられる部 分(「変数部」または,単に「変数」とも言う)から構成されるパターンで表現 する[*] .但し,前者は,字面で記述され,後者は,通常,記号で記述される. 

ここでは,このような構造規則は,曖昧性が問題となる表現の種類毎に収集さ れるものとする.例えば,名詞句「東京の叔父の息子」では,名詞「東京」の係 り先の解釈が問題となるが,これは,「$AのBのC$」($A,B,C$は,いずれも 名詞)の形の名詞句における名詞$A$の係り先の問題として構造規則を用意する. 「美しい私の娘」における形容詞「美しい」の係り先の問題では,「形容詞+$A
のB$」の表現構造における形容詞の係り先多義の問題として別の構造規則を作成 する.また,名詞句「$A
のB$」の英語への翻訳規則の場合,「山の頂上」(top of the mountain),「すべての学生」(all of the students),「私の友人」 (my friend),「嵐の夜」(stormy night),「京都の寺」(temple in Kyoto) などのように,名詞$A$と名詞$B$の組み合わせの違いなどによって,訳し方に多義 が存在するが,これも表現構造と解釈の関係として定義される.すなわち,「東 京の叔父の息子」と「美しい私の娘」に対する係り受け解析では,異なる規則集 合を作成する.また,名詞句「$A$$B$」の翻訳の問題でも別の規則集合を作成す る.

このように,構造規則の対象とする表現を,曖昧性の問題となる表現の種類毎 にパターン化した場合,表現パターン内の定数部分は省略し,変数部分のみによっ て表現構造を定義しても問題はないから,パターン化された表現の中から変数部 分だけを取り出し,表現の構造を変数の組(tuple)として表現する.

以上から,本論文では,多義解消のための構造規則の基本形を下記の通りとす る.

  $\textstyle {(A_1,A_2,A_3,\dots,A_N:C)}$   (1)
  $\textstyle 但し,{A_i}:変数部,{N}:変数の数,{C}:クラス$    

以下では,構造規則のうち, ${A_1,A_2,A_3,\dots,A_N}$ の部分を「構造定 義部」,$C$の部分を「クラス定義部」と呼ぶ.


Jin'ichi Murakami 平成13年1月17日