next up previous contents
次へ: ヒューリスティクス 上へ: 適合パターンの選択 戻る: 適合パターンの選択   目次

選択に用いる特徴量

本方式において,次の点から特徴量を求めることにした.

「意味解析」に関する特徴量について説明する.

本章で示した情緒推定方式では,統語的な制約の充足は$SPM$で保証されているが, 意味的な制約の充足は保証されていない. そこで,適合結果に対して,意味属性制約の充足についての特徴量を測る必要がある. たとえば,表現「建設会社が橋を黒部川に掛ける」に, 次の2つのパターンと統語的に適合したとする.

前者のパターンは,N2とN3の意味属性制約が満たされないまま適合し, 後者のパターンは,いずれの変数も意味属性制約が満たされている. パターンに対応する意味を見ると,後者のパターンの方が適切である. こうして,意味属性制約により適切なパターンを優位にすることができる.

「無生物主語」については,日本語の理解のしやすさに関わるものである. 無生物主語を持つ文型パターンは,無生物主語をもつ入力文と適合すると, 適切さが高く,無生物主語をもたない入力文と適合すると,適切さは低いと予想される. たとえば,表現「疲れる」に,次の2つのパターンが適合したとする.

通常「疲れる」という表現からは「人が疲れる」や「体が疲れる」という解釈をしやすく, 「機械が疲れる」という解釈はしにくいと予想される.

「非線形の強さ」については,慣用句を表すパターンの適合を特徴づける効果がある. 慣用句のパターンの場合,字面でパターンが記述される. そこで,字面の記述子に適合した単語数が,非線形を表す特徴量になる. たとえば,表現「へまを遣る」に,次の2つのパターンが適合したとする.

「へま」は「抽象物」の下位概念なので,両パターンは,統語的にも意味的にも適合する. しかし,前者のパターンの方が,非線形要素として適合する単語数が多く,鋭く意味解析ができている.

「文型パターンの適合性」については, 変数や字面という制約をより多く満たしながら適合したユニットを優先するという考え方である. たとえば,表現「田舎に帰る」は,「N1(人 動物)がN2(場所 場 抽象物 人間活動)から/よりN3(場所 場)に/へ帰る」 という1つのパターンであっても,離散記号が格要素と対応するために,複数の適合の仕方がある.

この例の場合,前者の適合の仕方が妥当である.

一方,「情緒推定に関わること」として,情緒主が「主体」であることという条件付けは自明である.

「辞書の構造に関すること」については,同一パターンに複数の情緒属性セットを付与するとき, 分析者が思いついた順に付与されたと仮定すると,枝番の小さいものの方が, 人が言語理解の際に思いつきやすいものだと考えられることから設定した. たとえば,「N1が/からN2に/と/へ挨拶する」というパターンには, 次の2つの情緒属性セットが対応づけられている.

好きな人から挨拶してもらうと好ましいと感じるが, 見ず知らずの人から挨拶されると好ましくも嫌だとも感じないということを, さらには,お付き合いを遠慮したいと思っている人からあいさつをされると嫌だと感じることを, これらのパターンは表現している.



平成25年2月12日