next up previous contents
Next: 目次 Up: master_thesis Previous: master_thesis   目次

概要

本研究では,パターン辞書を用いた名詞述語文の意味解析の方法について議論す る.この方法では,入力文をパターンと照合すると,複数の照合結果が得られる. その中から照合結果の選択を行うことで,意味が解析されたことになる.パター ン辞書について,用言述語文を対象とするものとして日本語語彙大系が既に存在 する.重文複文を対象とするパターン辞書として鳥バンクが存在する.名詞述語 文を対象とするパターン辞書は存在しない.既存のパターン辞書では網羅されて いない文型が存在するので,その文型を網羅するパターン辞書を作成する必要が ある.次に,パターン運用する場合,照合結果の選択が必要である.単文の場合 は,主語および述語の意味属性コードを利用するが,重文複文では,主部や述部 の具体性の判定において意味属性コードだけでは不足しており,主語の前の連体 修飾表現の有無などの文構造の確認を加えて行う必要があるため,照合結果の選 択条件が複雑になる.そこで,本研究では,名詞述語文の意味分類を確認し,名 詞述語文を対象とするパターン辞書を作成するとともに,照合結果の選択条件を 判定するために意味属性コードを利用する方法,および,機械学習を利用する方 法を試みる.

以上について具体的に,まず,名詞述語文の意味分類を確認のため,名詞述語文 の先行研究における例文,および,Wikipediaの文を対象に文の構造について分 析を行う.次に,分析結果を基にパターン化基準を作成し,パターン辞書のエン トリを作成する.作成した結果,例文41文から21エントリを作成できた.次に, パターンの照合結果の選択を行う方法を開発する.選択は,「意味属性コードを 利用した照合結果の選択」の方法,および,「機械学習を利用した照合結果の選 択」の方法の2つを提案する.

評価実験の結果,クローズドテストおよびクロスバリデーションでは,再現率, 適合率,および,$ F$ 値の全てが,「意味属性コードを利用した照合結果の選択」 が上回り,オープンテストでは,再現率は「意味属性コードを利用した照合結果 の選択」が,適合率は「機械学習を利用した照合結果の選択」がそれぞれわずか に上回った.誤りの主な原因は,単語を固有名詞とみなす処理が不足していたこ とだった.固有表現解析の問題として解決が可能と考えると,本研究により名詞 述語文の意味解析のためのパターン辞書の構築および運用について方法を示すこ とができたといえる.

以上により,本研究では,名詞述語文の分類を,範疇叙述型,属性叙述型,およ び,外延叙述型に分類とすることに問題ないことを確認した.パターン化の基準 を示したので,パターン辞書の構築が可能になった.名詞述語文の例文を基に41 文から21エントリを得た.パターンの運用は,実験により,パターンの網羅性は 良好であり,照合結果の選択は,現状では意味属性コードを利用する方法,およ び,機械学習を利用する方法のどちらも適応できることを確認した.



2015-03-14