next up previous contents
次へ: 正答候補抽出PTの作成 上へ: 質問文解析モジュール 戻る: 検索KWの作成   目次

検索KWのスリム化

複文や重文など,比較的長い文章は,検索KWとして用いると,WEB検索において検 索結果が出力されない場合がある.そこで田村の研究[6]では,長文で ある質問文を解析し,検索KWの形を「従属節の名詞+主節」とすることで 検索KWのスリム化を図り,WEB検索の結果出力数を増加させようと試みた.

主節の判定には係助詞の「は」や格助詞の「が」を利用する.日本語において主 節は文の後半に置かれることが多いことから,検索KWから「のは」を除いた文に 対して,もっとも後ろにある「は」「が」を糢とに判定を行う. 図6 に「雨が降っても海がいっぱいにならないのはなぜ」 における検索KWのスリム化の例を示す.

図 6: 検索KWのスリム化の例
\begin{figure}\begin{center}
\Ovalbox{\parbox{10cm}{\vspace*{0.2cm}
-質問文-\\
...
...W-\\
雨+海がいっぱいにならないのは
\vspace*{0.2cm}
}}
\end{center}
\end{figure}


root 平成21年3月14日