- ...SVM)4.1
- 具体的にSVMにはTinySVM[8]を用いる.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...svm参照4.2
- 図の
白丸,黒丸は,正例,負例を意味し,
実線は空間を分割する超平面を意味し,
破線はマージン領域の境界を表す面を意味する.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
出力結果から下枠内のように「品詞:単語」の形で抽出したものを素性として用いる5.1
- 例.名詞:子供
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.2
- 例.旧名詞:子供,新名詞:児童
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
段落Aに対し,連体詞が出現するように素性として組み込む5.3
- 例.「L特定品詞:1」段落Aに特定品詞がある,「R特定品詞:0」段落Bには特定品詞がない
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.4
- 例.「L日付:1」段落Aに日付けがある,「R日付:0」段落Bには日付がない
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
データ内では,「LR類似数L○:X (以上)」や「LR類似数L○:X-1〜X+1(X-1からX+1の区間)」として素性を組み込んでいる5.5
- 例.「LR類似数L○:7 」段落AB間での一致数が7個以上,「LR類似数L○:6〜8」段落AB間での一致数が6から8の間にある
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
を場合わけし素性として組み込む5.6
- 例.「LR類似数L×:10 」段落AB間でAにのみ出現する単語数10個以上,「LR類似数L×:8〜」段落AB間でAにのみ出現する単語8以上
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.7
- 例.「LR類似度L×:0 」Aにのみ出現する単語数からBにのみ出現する単語数を引いた数が0以上
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる(ここで,Pは以前の段落を表す)5.8
- 例.「P類似数L○:4 」PA間の単語の一致数が4個以上,「P類似数L○:4〜6」PA間の単語の一致数が4から6の間にある
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.9
- 例.LR新規:0超過,LR新規:0未満
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.10
- 例.LR新規比率:L
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.11
- 例.一文一致数:4,一文区間:4〜5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.12
- 例.一文比率一致数:4、5,一文比率区間:4、5〜5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.13
- 例.一致数:8,区間:8〜8、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.14
- 例.比率一致数:3,比率区間:3〜3、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.15
- 例.P一文一致数:9,P一文区間:9〜10
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.16
- 例.P一文比率一致数:3,P一文比率区間:3〜3、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.17
- 例.P一致数:4,P区間:4〜4、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
素性を組み込んでいる5.18
- 例.P比率一致数:5,P比率区間:5〜5、5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
実験2の場合での,Case1の順序推定を行う場合は毎日新聞1993年6月の1ヶ月分,Case2の順序推定を行う場合は毎日新聞1993年7月の1ヶ月分,Case3の順序推定を行う場合は毎日新聞1993年8月の1ヶ月分を用いる7.1
- テストデータ:ランダムに2段落1組を50組抽出
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
テストデータ内の各事例に対する分離平面との距離dが算出される8.1
- 黒丸はテストデータ内の事例1個を示し,距離dは事例と分離平面との最短距離を示す
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
に対しての分類先を示す8.2
- ``,''や``@''を用いて分割するため,素性内の全角``、''は表記ミスではない
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...bunsekikekkaに示す
8.3
- 素性IDは表5参照
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...hikaku_1)9.1
- X,Yが同じ値の場合,A→Bの順序に対して出力をする
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.