パターン辞書は,用言述語文を網羅するものとして日本語語彙大系[3] が既に存在する.重文複文を網羅するパターン辞書に鳥バンク[4] が既に存在する.ここで,単文の名詞述語文を網羅するパターン辞書は存在しな い.
このように,既存のパターン辞書で網羅されていない文型が存在するので,その 文型を網羅するパターン辞書を作成する必要がある. 名詞述語文を網羅するパターン辞書が存在しない理由は,名詞の数が,用言の数 と比べ,非常に多く,かつ,名詞そのものが新しく作られるためと思われる. 日本語語彙大系の用言述語文のパターンは,用言を文字に残し,単語ごとにパター ンを作成している.用言は約6,000語あり,単語に多義性があるので,約16,000 パターン収集された.名詞述語文のパターンを名詞を文字に残した述語パターン を作ろうとすると,前述した通り非常に多いので,パターンが膨大な数になる上, 名詞そのものが新しく作られるため網羅できなくなる問題もある.ゆえに,名詞 述語文を対象としたパターンを作成するには,述語の名詞を変数化せざるを得な い.述語を変数化したので,述語の単語ごとに意味を分けることはできないので, 名詞述語文の構造が伝える意味を分析する必要がある.
次に,パターン辞書が構築できたと想定しよう.一般に,パターン辞書を用いた 意味解析は,入力文をパターンと照合すると,複数の照合結果が得られる.その 中から照合結果の選択を行うことで,意味が解析されたことになる.日本語語彙 大系では,意味属性コードを利用し選択処理を行なっている.名詞述語文の意味 解析においても,意味属性コードを利用した選択処理を試みる.さらに,意味属 性コードだけでは,選択できないことが予想されるため,新たな方法についても 試みる.