next up previous contents
Next: 実行の様子 Up: 意味属性を利用した照合結果の選択 Previous: 意味属性を利用した照合結果の選択   目次


原文との意味的な近さ

入力文とパターンの原文が意味的に近いことを条件に, 最適な適合結果を選ぶ. 上位語や属性表現の意味の近さを重視しており, 式(5.1)で最適な適合結果$ \hat{m}$ を求める.


$\displaystyle \hat{m} = \mathop{\rm arg~min}\limits _{\substack{m \in M \\ (C_{...
...\in C_{述}}}\left\{w_1d\left(c_1,c_2\right) + w_2d\left(c_3,c_4\right)\right\}$     (5.1)

ここで,$ M$ は適合結果の集合, $ m$ は適合結果(原文,パターン,型名,意味制約,3つ組,および,パターンマッチで代入される変数値で構成.なお,$ M$ は原文の数および代入のバリエーションにより増大), $ (C_{主},C_{述})$ $ m$ からとり出される意味制約であり, $ C_{述}$ はなかでも述語に対する集合(例1では, $ \{1035,893\}$ ), $ C_{i主}$ は入力文$ i$ の主語の意味コードの集合(一語につき複数のコードが存在), $ C_{主}$ $ C_{i述}$ も同様の集合, $ (w_1,w_2)$ は,$ m$ の型が外延叙述型ならば$ (1.0,0.1)$ とし,その他ならば$ (0.1,1.0)$ とする. $ d$ はシソーラス $ \cite{Ikehara97}$ において,2つの意味コードの距離を表す関数である.

シソーラスは,名詞の概念の上下関係を木構造で表す. ルートノードは最上位であり,抽象度が最も高い. 下位ノードであるほど具体的である. ノードは意味コードが付与されている. アークは上下関係のあることを表す. 関数$ d$ は,2つの意味コードに対応するノード間のアーク数を返すことで, 意味の距離を表す.



2015-03-14