次へ: a7:素性a6の値と推定する2段落を入れ替えた場合の素性a6の値の2つの差
上へ: 提案手法に用いる素性
戻る: a5:1段落目と2段落目に出現する名詞が一致した数
目次
用いられない単語の数が推定の鍵になると考え素性として組み込む.
素性a6は2段落目に出現する名詞のうち,
1段落目の名詞と一致しなかった名詞の数Xのことである.
その値を求め,素性a5同様の場合分けしたものを素性とする.
素性a9も同様に前部に出現する名詞に限ることのみ,素性a6と異なるだけであるため説明を省略する.
データ内では,「LR類似数L×:X 」や「LR類似数L×:X-1〜X+1」として
素性を組み込んでいる(「LR類似数L×:X 」のLRは推定する2段落を示し,
L×は段落Bにはなく段落Aにのみ出現する単語について示し,
「:」以降に求めた値を示す).
図5.6のように,
段落Bの名詞の数(19)から段落Aと段落B内の名詞の共起数(7)を引いた数(12)
を場合わけし素性として組み込む5.6.
平成27年3月4日