next up previous contents
次へ: アルゴリズムの概略 上へ: 文の構造的類似性判定法 戻る: 類似性判定アルゴリズム   目次

日本文における係り受けの特徴

ここで、類似文の決定において、以下の日本文における 係り受けの特徴を使用する。また、今後矢印は文節間の 係り受け関係を表すものとする。

  1. 非交差条件

    日本語の係り受け文法において、 「日本語文内の係り受け関係は互いに交差することはない」 という、非交差条件と呼ばれる優先規則がある。 これは、「これが僕は正しいと思う」というように破られる例も あるが、書き言葉ではほとんどの場合成り立つことから、本研究では 絶対的な規則(制約)として用いる。



    \includegraphics[width=6.3cm,keepaspectratio]{toku1.eps}

  2. 係り先は後方のみである

    係り先となる文節は必ず係り元の文節よりも後方にくる。 下図で示されるように、 \framebox[1cm]{C} \framebox[1cm]{B} という 後方から前方へと係るような係り受け関係は存在しないものとする。



    \includegraphics[width=4cm,keepaspectratio]{toku2.eps}

  3. 係り先は1つだけである

    係り受け文法における曖昧性の問題(例えば、「AのBのC」のような AがBにもCにも係り得るという連体修飾語の係り先の曖昧性など)について、 本研究で扱う係り受け関係は、係り先は1つに決定されており、曖昧性は ないものとする。



    \includegraphics[width=4.9cm,keepaspectratio]{toku3.eps}



平成14年5月1日