next up previous contents
Next: 目次 Up: soturon Previous: soturon   目次

概要

文章中での登場人物や物体がどの場所にあるのかを文章から解析する技術が必要とされている. この技術は文章の中の登場人物の場所の他,物が誰の手元(もしくは場所)に存在しているのかも明確にする. そして,この技術は観光分析に必要とされている. 先行研究[1]では,ブログ記事から「ドクターイエロー」や「赤福」の場所を自動抽出する手法を提案した. しかし,文の中にある言葉の意味を辿るということを行っていなかった. そこで本研究は入力を一連の動作を表す文章とし,動作を表す用言の意味を辿ることで存在性情報を得ることを目的とする.

本研究の流れは以下の通りである.存在性をパターン型知識として収録した辞書を用いて,入力文を照合し,存在性情報を抽出する. この辞書からは,動詞の文字通りの解釈により,動詞ごとに事態の直前,最中,完了のタイミングで存在性が定まる. そして抽出した存在性情報を常識的な知識の解釈により,異なる存在性情報をより多く求め,信念の木というデータ構造(正確にはラティス構造)に追加する. 最後に作成した信念の木のルートからリーフへのパスを作成する.そして,どのパスが最も良いのかを解析するために,制定した条件に当てはまると得点が加算されるという方法で,全パスについて点数をつけて最も点数の高いパスを求める.

本研究では,「太郎が図書館で本を読む」,「太郎が本を借りる」,「太郎が家に帰る」という3文を用いて存在性情報を得るという実験を試みた. 入力した3文について上記の流れで存在性情報を抽出した結果,まず,データ構造の信念の木は,深さ6,ノード数24,アーク数102となり最終リーフは4つとなった. このとき作成されたパスは1024個となった. 次に,選択により得た最高得点は11点,最高得点に該当したパスは2つとなった. このパスの最終リーフは,人間が常識的に考える存在性と一致したので,存在性情報抽出は成功したといえる.



root 2015-03-17