next up previous contents
次へ: アルゴリズム動作確認の実験 上へ: mysoturon 戻る: アルゴリズム全体の適用例   目次

類似文検索システム

本研究で提案したアルゴリズムの動作を確認するため、 これまで述べてきたアルゴリズムに基づいた類似文検索システムを 試作した。図11にシステムの実行イメージを示す。

入力文として、文節とそれに対応する係り受け関係の情報を入力する。 前述のアルゴリズムに従い、#1で手法[3]により 文節の照合を行い一致文節を抽出する。抽出された一致文節 数上位の候補から順に、 #2により係り受けを構成しない文節を削除し、その後#3により 入力文との係り受けの対応を示す文節対応マトリックスを作成する。 マトリックスにより、各候補において最大となる一致ペア数を発見する。 各候補について一致ペア数を決定していくが、係り受けを構成する 最小の文節数である一致文節数2までの候補全てに対して#2と#3を繰り返し 適用するものとする。 得られた各一致ペア数の中から、一致ペア数が最大となる文が 入力文に最も類似した文である。複数の候補が存在する場合、 その全てを出力する。

今回の研究では、アルゴリズムの動作確認が目的であるため、全ての一致ペアの 候補を抽出するようにシステムを構成した。繰り返し回数は、厳密には 上位の候補により得られた結果によりその都度変動するものであり、 最適な文が1つ決定できればよいので全ての候補に対してアルゴリズムを 適用するのは時間の無駄である。 検索にかかる時間の正確な計測を行っていないため、高速化の 問題はプログラムの最適化と合わせて今後の検討の対象とする。

図 11: 試作したシステムの実行イメージ
\includegraphics[scale=0.855,keepaspectratio]{zentai.eps}



平成14年5月1日