本研究では係り受け関係を用いて 類似文の決定を行なう。類似文の決定において、 以下の日本文における係り受けの特徴を規則 として使用する。 アルファベットを四角で囲んだものを一つの文節とし、 文節同士を結んだ矢印は係り受け関係を表わす。
日本語の係り受け文法において、 「日本語文内の係り受け関係は互いに交差することはない」 という、非交差条件と呼ばれる優先規則がある。 これは、「これが僕は正しいと思う」というように破られる例も あるが、書き言葉ではほとんどの場合成り立つことから、本研究では 絶対的な規則(制約)として用いる。
係り先となる文節は必ず係り元の文節よりも後方にくる。 下図で示されるように、 → という 後方から前方へと係るような係り受け関係は存在しないものとする。
係り受け文法における曖昧性の問題(例えば、「AのBのC」のような AがBにもCにも係り得るという連体修飾語の係り先の曖昧性など)について、 本研究で扱う係り受け関係は、係り先は1つに決定されており、曖昧性は ないものとする。