next up previous contents
Next: 関連研究 Up: はじめに Previous: はじめに   目次

背景

自然言語処理において,パターンを利用した処理が行われている.ここで言うパ ターンは,言語表現の構造を表すパターンであり,文字や変数で記述される.パ ターンは,文中に存在する意味を取り出すことができると考えられている.意味 を取り出すためにパターン辞書が構築されており,機械翻訳[1]や 情緒推定[2]が研究されている.

パターン辞書は,用言述語文を網羅するものとして日本語語彙大系[3] が既に存在する.重文複文を網羅するパターン辞書に鳥バンク[4] が既に存在する.ここで,単文の名詞述語文を網羅するパターン辞書は存在しな い.

このように,既存のパターン辞書で網羅されていない文型が存在するので,その 文型を網羅するパターン辞書を作成する必要がある. 名詞述語文を網羅するパターン辞書が存在しない理由は,名詞の数が,用言の数 と比べ,非常に多く,かつ,名詞そのものが新しく作られるためと思われる. 日本語語彙大系の用言述語文のパターンは,用言を文字に残し,単語ごとにパター ンを作成している.用言は約6,000語あり,単語に多義性があるので,約16,000 パターン収集された.名詞述語文のパターンを名詞を文字に残した述語パターン を作ろうとすると,前述した通り非常に多いので,パターンが膨大な数になる上, 名詞そのものが新しく作られるため網羅できなくなる問題もある.ゆえに,名詞 述語文を対象としたパターンを作成するには,述語の名詞を変数化せざるを得な い.述語を変数化したので,述語の単語ごとに意味を分けることはできないので, 名詞述語文の構造が伝える意味を分析する必要がある.

次に,パターン辞書が構築できたと想定しよう.一般に,パターン辞書を用いた 意味解析は,入力文をパターンと照合すると,複数の照合結果が得られる.その 中から照合結果の選択を行うことで,意味が解析されたことになる.日本語語彙 大系では,意味属性コードを利用し選択処理を行なっている.名詞述語文の意味 解析においても,意味属性コードを利用した選択処理を試みる.さらに,意味属 性コードだけでは,選択できないことが予想されるため,新たな方法についても 試みる.



2015-03-14