next up previous contents
Next: 検索対象データベース Up: 類似文検索における係り受けの効果 Previous: 類似文検索における係り受けの効果

類似文検索システム

本研究で提案したアルゴリズムの有用性を確認するため、 これまで述べてきたアルゴリズム に基づいた類似文検索システムを 試作した。図12にシステムの実行イメージを示す。

入力文として、文節とそれに対応する係り受け関係の情報を入力する。 前述のアルゴリズムに従い、#1により 一致文節を抽出し、一致文節数で順位づけする。一致文節 数上位の候補から順に、 #2により係り受けを構成しない文節を削除し、その後#3により 入力文との係り受けの対応を示す係り受けペア対応マトリックスを作成する。 マトリックスにより、各候補において最大となる一致ペア数を発見する。 各候補の一致ペア数を決定し、その時 得られた一致ペア数から繰り返し条件を設定する。 繰り返し条件を満たす候補に対して、#2と#3を適用する。 繰り返しが終了した時点で、 得られた一致ペア数が最大となる文が 入力文に最も類似した文である。複数の候補が存在する場合 その全てを出力する。


  
Figure 12: 試作したシステムの実行イメージ
\includegraphics[scale=0.8,keepaspectratio]{zentai.eps}




2002-03-06