次へ: a20:1段落目と2段落目に出現する新規単語の数の差
上へ: 提案手法に用いる素性
戻る: a7:素性a6の値と推定する2段落を入れ替えた場合の素性a6の値の2つの差
目次
連接する段落間の情報は似通っている方が内容の理解がしやすいため,文章の順序としては良い.
このことから推定する2段落と存在する記事内以前全ての段落との名詞の共起した数をそれぞれ求め,
その値が,0以上,1以上,2以上,3以上を最大値10まで,
0以上2未満,2以上4未満,4以上6未満を2ずつ増加し最大値8までの範囲で場合わけしたものを素性とする.
素性a12から素性a19までは前の素性を組み合わせることにより,素性を取得できるため,説明を省略する.
データ内では,「P類似度L○:X 」または「P類似数L○:X〜X+2」として
素性を組み込んでいる(ここで,Pは以前の段落を表す)5.8.
図5.8のように,
推定する2段落A,Bより以前の確定している段落Pが与えられたとする.
「P→A」間,「P→B」間の名詞の共起数をそれぞれ求める(4),(1).
求められた2つの値を場合わけし素性として組み込む.
平成27年3月4日