next up previous contents
次へ: 情緒の推定 上へ: 言語の意味理解 戻る: 言語の意味理解   目次

日本語語彙大系

本研究では,日本語の用言の語義は,日本語語彙大系[6]における結合価パターンで捉える. 日本語語彙大系は,日本語の基本的な用言6,118語について, 日英機械翻訳のためにその語義を網羅的に記述した結合価パターン14,819件を収録している. 結合価パターンは,格要素と用言で構成する. 格要素は,ある程度表現に自由度がある場合は一般意味属性制約で制約された変数で記述し, 慣用句のように表現が固定的な場合は字面で記述する. 用言は字面のみである.

以下に「合う」という用言について例を示し,結合価パターンにより語義が区別されることを説明する.
    #1 $N$1(495 河川)が $N$2(495 河川)と 合う
    →$N$1 join $N$2(結合動作)
    #2 $N$1(*)が $N$2(2449 条件 1176 需要 1361 願望・失望)と/に 合う
    →$N$1 meet $N$2(属性)
    #3 $N$1(3 主体)が $N$2(3 主体)と 話が 合う
    →$N$1 and $N$2 has common topics(相対関係)

「合う」という用言には,34種類の結合価パターンが存在する. ここには,そのうちの3つが示されている. $N$1や$N$2は名詞(句)とマッチする変数である. 変数の後の数字とラベルは,変数にマッチしてもよい名詞の意味属性である. たとえば,「太郎が入社の条件に合う」という文とマッチするパターンは,#2である. 「太郎」は「河川」でないのでこの文は#1にマッチしない. #2は「が格」も「に格」もマッチするため,文全体がこのパターンにマッチする. #3は「話が合う」という字面が必須であるためこの文はマッチしない.

日英機械翻訳を精度良く行うために語義の分解能が設定されているが, 英語パターンの後ろに表示している「用言意味属性」からわかるとおり, 日本語の語義を大きく逸脱するレベルの分解能ではない. ゆえに,結合価パターンの1つずつについて用言の語義をパターンから解釈することができる.



平成25年2月12日