next up previous
Next: 謝辞 Up: No Title Previous: 基底数削減に関する実験

おわりに

従来、ベクトル空間法では、文書の意味的な特徴を表す特性ベクトルの基底に、文書中に現れる単語を使用するのが一般的であったが、本論文では、単語の代わりに単語意味属性を使用する方法を提案した。 また、意味属性間の意味的な上下関係を利用し、検索精度をあまり低下させないで基底を削減する方法を示した。 BMIR-J2の5,080記事を検索対象とした検索実験の結果によれば、提案した方法は、単語の揺らぎに影響されず、同義語、類義語の存在も検索の対象となるため、キーワード検索における、シソーラスを使用したキーワード拡張と同等の効果があり、従来の単語ベクトル空間法に比べて、高い再現率を得られるが、反面、検索ゴミを拾いやすく、適合率が低下することが分かった。

本論文では、単語の多義性については考慮しなかったが、意味属性体系の持つ能力を用いて単語の多義を解消することも検討していきたい。 また、基底数をさらに削減する方法として、意味属性体系の上位属性から順に検索ゴミを発生しやすいと意味属性を削除する方法が考えられ、今後は基底数削減についてLSI法との比較も検討していく予定である。


 


2000-05-30