next up previous contents
次へ: 類似文検索システム 上へ: 文の構造的類似性判定法 戻る: 同一係り受け文節ペアの発見(#3)   目次

アルゴリズム全体の適用例

これまで述べてきたアルゴリズムを、以下のような係り受け関係を持つ 入力文とDB文に対して適用する。日本文との対応付によりアルゴリズム 全体の流れを追う。

\includegraphics[width=8cm,keepaspectratio]{japan1.eps}

まず入力文とDB文の各文節を、同一種類の文節に変換する。 ここで、「どのような文節を同一の種類とみなすか」 という問題が生じるが、これは検索の利用者によって 同一とみなす範囲が異なってくるため、この問題は本研究では 扱わないことにし、上記の例文に対しては次のように 文節の同一性を設定し、各文節を アルファベットA〜Eに変換する。

アルファベットに変換した文節に対して、アルゴリズムを適用する。 手順に従った処理過程を図10に示す。 #1により、入力文と一致する文節が抽出される。 #2,#3により係り受け関係の類似性を 判定し、係り受けの一致する文節ペア数の多いDB文1が最適な文と決定される。

図 10: 適用例実行の流れ
\includegraphics[scale=1.1,keepaspectratio]{japan_img2.eps}



平成14年5月1日