next up previous contents
Next: アルゴリズムの概略 Up: 類似性判定アルゴリズム Previous: 一致文節と判定基準

アルゴリズム全体の流れ

2に示すように、3つの手順に分割して アルゴリズム全体の流れを構成する。

1.
一致文節の抽出

DBの中から入力文と同一の文節を含む文の一致文節を 抽出する。抽出された文を一致文節数が 多い候補から順にソートする。 上位の候補から順に、#2と#3を適用する。

2.
係り受けを構成しない文節を削除

入力文とDB文の各々の一致文節間で係り受けを構成しない 文節は削除する。係り受けを構成する一致文節同士を 1つのペアとして扱い、次の#3を適用する。

3.
最大一致ペアの発見

係り受け関係の一致する文節ペア数(一致ペア数)が、 最も多くとれる組み合わせを発見する。 得られた一致ペア数から繰り返し条件を設定する(詳細は後述)。

#2と#3を各候補に適用し、各々の一致ペア数を決定する。 条件を満たし繰り返しが終了した時点で、得られた一致ペア数が 最大の候補が最も類似した文となる。


  
Figure 2: アルゴリズム全体の流れ
\includegraphics[width=13cm,keepaspectratio]{alg_zu.eps}





2002-03-06