next up previous contents
次へ: 中国語結合価パターンの作成方法 上へ: 日中結合価パターンの部分試作 戻る: 日中結合価パターンの部分試作   目次

日本語語彙大系の結合価パターン

本論文では,岩波の日本語語彙大系[2]の結合価パターンを日本語結合価パターン辞 書として,用いる.本研究では,使用される日本語結合価パターン辞書を以下に詳しく説明 する.

まず,岩波の日本語語彙大系の構成を説明する.岩波の日本語語彙大系は,「意味属性体系」,「単語体系」と 「構文体系」の3体系から構成される.

「意味体系」は,日本語の一般名詞,固有名詞,用言の意味的用法を3,000の意 味属性で体系化した「意味属性体系」と,意味属性ごとにその属性をもつ単語を 集めた「意味属性別単語表」からなる.

「単語体系」は,日本語の意味的用法を3,000の意味属性を用いて定義したもの.一般名詞のほかに使用頻度の高い固有名詞や新聞記事に現れる時事用語なども含む30万語を収録する.

「構文体系」は,日本語の用言6,000語の文型を結合価パターンにまとめたもの.一般の文型と慣用的表現の文型を合わせて14,000の日本語文型パターンにまとめ,同時にそれに対応する英語の文型パターンを収録する.

これら3つの体系を合わせて,日本語結合価パターンとして,機械翻訳,構文解 析などよく使用されます.以下は,結合価パターンの記述例である.
なお,[  ]内の記述はパターンが可能の文型状態である,( )内の数値は意味属 性である

$N1$の意味属性:(*全ての意味属性)
$N2$の意味属性:(388場所  533具体物  1000抽象) $N1$の意味属性:(4人)
$N2$の意味属性:(838食料    1253感情)

平成18年4月11日