Next: mkboth
Up: No Title
Previous: 基底数削減に関する実験
従来、ベクトル空間法では、文書の意味的な特徴を表す特性ベクトルの基底に、文書中に現れる単語を使用するのが一般的であったが、本論文では、単語の代わりに単語意味属性を使用する方法を提案した。
また、意味属性間の意味的な上下関係を利用し、検索精度をあまり低下させないで基底を削減する方法を示した。
BMIR-J2の5,080記事を対象とした検索実験の結果によれば、提案した方法は、キーワード検索における、シソーラスを使用したキーワード拡張と同等の効果があり、表記の揺らぎに影響されず、従来法と比べて、高い再現率が得られることが分かった。
また、本方式は基底削減に強い方法であり、検索精度を落さず、基底数を約300種まで削減することができることがわかった。
しかし、単語ベクトルの場合に比べ、ゴミを拾いやすく、適合率が低下する。
今後は、単語の多義性の解消やゴミを発生しやすい意味属性を選択して削除するなど、適合率を向上させる方法について検討していきたい。
2000-05-30