next up previous contents
Next: 本論文の構成 Up: はじめに Previous: はじめに

研究背景と目的

自然言語処理の最大の問題は、表現の構造と意味に関する解釈の曖昧性である。 いままで、多くの研究が行われてきたが、確率的、文法的情報に頼った従来の方 法では、これらの問題を解決するのは困難であった。

日本語名詞句の解析では、従来、コーパスの基づく方法として、単語の共起情報 を用いて係り先を決定する方法[4]、意味的クラスの共起情報を用 いて係り先を決定する方法[5][6]、また、名詞句解析で は、大量の対訳用例の中から意味的に類似した表現を発見し、翻訳結果を得る方 法[2]などが提案されてきた。しかし、共起情報を用いる手法は、 意味的な関係を考慮に入れないため、精度に限界がある。また、用例翻訳は 、通常、コーパスから得られる標本はスパースであり、適切な用例がない場合に は、結果は保証されない。また計算量が膨大となることなどが問題であった。

これに対し最近、動詞の意味の解析用に意味属性体系 [1]が開発された。 この辞書の知識は、格要素として使用された名詞の意味を動詞との 共起によって解析する場合も使用できる。 さらに、名詞の意味を詳細に分類(約2,700種類)しているため、そこで規定された 単語意味属性の情報は、名詞句内で使用された名詞の意味解析にも有効と 期待される。

そこで、名詞句の持つ意味的な構造に着目して、名詞と名詞の間の構造規則 を意味属性を用いて記述する。このとき、構造規則を標本から得られたデータ から自動生成する。

具体的には、日本語名詞句の中でも最も基本的でかつ、高頻度で出現する「の」 型名詞句(「AのBのC」)を対象に、単語意味属性体系において定義された名詞 の意味的用法の上位下位概念を用い、3つの名詞A、B、C間の意味的構造規則を生 成する。このとき、3つの名詞すべてが決まらなくても係り受け関係が決定でき ることを考慮にいれ、3つの名詞の組の規則、2つの名詞の組の規則、1つのみの 名詞の規則の3タイプの規則を名詞句標本データから自動生成する手法を提案す る。そして、得られた構造規則を別の名詞句標本に適用して解析精度を評価する。



Charlie &
1999-06-03