next up previous contents
次へ: 目次 上へ: graduation_thesis 戻る: graduation_thesis   目次

概要

日本語語彙大系のパターンを用いたブログの解析が行われている. 日本語語彙大系は用言述語文をカバーする. しかし,名詞述語文はカバーしていない. 例えば,``ノドグロを食べる''という用言述語文からは情緒を推定することができるが, ``ノドグロは境港産だ''という名詞述語文は無視されるため何の推定も行われない. そのため,ブログ文の意味解析に有用である文が無視されるため支障がある. 今田[1]は,生産物名詞を主語とする名詞述語文に着目し, 主語と述語の意味関係の観点における意味構造の類型化を試み, 「範疇叙述型」,「属性叙述型」,「外延叙述型」および「その他」の4つの類型に分類した.

そこで,本研究では,今田の分類をベースに名詞述語文の意味を解析するためのパターン辞書の作成 を目的とする.そのために以下のことを行う. まず,生産物名詞が主語である名詞述語文の事例を基にタグの付与および型名の追記を行い, パターン辞書を作成する. タグの付与および型名の追記は人手で行う. パターンの作成を行った結果,29件のパターンが作成できた. 次に,パターン照合による解析を行い,作成した辞書の性能を評価する. 解析の際,入力文に対し,複数の適合結果が出力される場合があるので,適合結果の縮退および 優先順位付けを行う.性能評価には,再現率,適合率および$F値$を用いる. オープンテストの結果,再現率は$0.32$,適合率は$0.05$$F値$$0.09$と低い値となった. 適合率が低い理由は,入力文に対する出力数が過剰であるためで,選択性能の強化が必要である. 再現率が低い理由は,入力文に正しく適合するパターンがないためで, パターンの規模の拡大および,パターンの拡張が必要である. 今後の課題として,パターン辞書の規模の拡大, パターンの拡張および適合結果の選択性能を強化が挙げられる.



平成25年6月20日