...SVM4.1
具体的にSVMにはTinySVM[8]を用いる.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...svm参照4.2
図の 白丸,黒丸は,正例,負例を意味し, 実線は空間を分割する超平面を意味し, 破線はマージン領域の境界を表す面を意味する.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 出力結果から下枠内のように「品詞:単語」の形で抽出したものを素性として用いる5.1
例.名詞:子供
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.2
例.旧名詞:子供,新名詞:児童
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 段落Aに対し,連体詞が出現するように素性として組み込む5.3
例.「L特定品詞:1」段落Aに特定品詞がある,「R特定品詞:0」段落Bには特定品詞がない
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.4
例.「L日付:1」段落Aに日付けがある,「R日付:0」段落Bには日付がない
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... データ内では,「LR類似数L○:X (以上)」や「LR類似数L○:X-1〜X+1(X-1からX+1の区間)」として素性を組み込んでいる5.5
例.「LR類似数L○:7 」段落AB間での一致数が7個以上,「LR類似数L○:6〜8」段落AB間での一致数が6から8の間にある
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... を場合わけし素性として組み込む5.6
例.「LR類似数L×:10 」段落AB間でAにのみ出現する単語数10個以上,「LR類似数L×:8〜」段落AB間でAにのみ出現する単語8以上
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.7
例.「LR類似度L×:0 」Aにのみ出現する単語数からBにのみ出現する単語数を引いた数が0以上
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる(ここで,Pは以前の段落を表す)5.8
例.「P類似数L○:4 」PA間の単語の一致数が4個以上,「P類似数L○:4〜6」PA間の単語の一致数が4から6の間にある
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.9
例.LR新規:0超過,LR新規:0未満
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.10
例.LR新規比率:L
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.11
例.一文一致数:4,一文区間:4〜5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.12
例.一文比率一致数:4、5,一文比率区間:4、5〜5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.13
例.一致数:8,区間:8〜8、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.14
例.比率一致数:3,比率区間:3〜3、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.15
例.P一文一致数:9,P一文区間:9〜10
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.16
例.P一文比率一致数:3,P一文比率区間:3〜3、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.17
例.P一致数:4,P区間:4〜4、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 素性を組み込んでいる5.18
例.P比率一致数:5,P比率区間:5〜5、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 実験2の場合での,Case1の順序推定を行う場合は毎日新聞1993年6月の1ヶ月分,Case2の順序推定を行う場合は毎日新聞1993年7月の1ヶ月分,Case3の順序推定を行う場合は毎日新聞1993年8月の1ヶ月分を用いる7.1
テストデータ:ランダムに2段落1組を50組抽出
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... テストデータ内の各事例に対する分離平面との距離dが算出される8.1
黒丸はテストデータ内の事例1個を示し,距離dは事例と分離平面との最短距離を示す
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... に対しての分類先を示す8.2
``,''や``@''を用いて分割するため,素性内の全角``、''は表記ミスではない
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...bunsekikekkaに示す 8.3
素性IDは表5参照
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...hikaku_1)9.1
X,Yが同じ値の場合,A→Bの順序に対して出力をする
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.