next up previous contents
次へ: 素性拡充後が不正解だった例 上へ: 実験結果 戻る: 実験2.素性拡充前と素性拡充後の提案手法と比較手法と人手推定の比較   目次

素性拡充後が正解だった例

本節では,素性拡充前が不正解で,素性拡充後が正解だった2例を記載する.

[
l](例1)正解:段落A 段落A:この作家は、歴史家でもあるウラジーミル・ゴニク氏。 資料を集め、関係者の取材を続けたうえ、自ら「第二の地下鉄」を歩いて調査した。
段落B:この地下鉄は、第二次世界大戦後、現在の地下鉄より深いところに掘られた。 長さは数十キロとされるが、正確な距離は不明。クレムリンからスターリンの別荘があった クンツェフ地区に通じる視線のほか、国家保安委員会(KGB)、外務省など国家の重要施設から トンネルを通り地下鉄に乗れる仕組みになっている。

例1では,段落A→Bの順序の場合に段落間の各文において単語「地下鉄」の共起がみられるため, 段落A→B間の内容は似通っていると判断し,段落Aが先にくると推定したと思われる.

[
l](例2)正解:段落A 以前の段落P:リクルートサーチがまとめた今年の大卒求人倍率調査(対象は来春卒業者)によると、大卒男子の求人倍率は二・二二倍で、一九八四年の調査開始以来最低となった。全国民間企業の求人総数は昨年より十万人少ない五十二・八万人。
段落A:求人数を企業規模別に見ると、従業員千人未満の企業で昨年の一三%減なのに比べ、千人以上の企業では二二%減。
段落B:また、文化系の求人倍率は二・〇一倍、理科系は二・五一倍。落ち込み幅は理科系の方が大きく、証券など非製造業での理科系採用減が響いたようだ。

例2では,例1同様に以前の段落P→A,段落P→Bの順序の場合に段落間の各文において 共に単語の共起がみられるため,それぞれの順序での各1文に対する単語の共起数を求めた結果, P→Aでは5つ(求人,企業,昨年),P→Bでは1つ(求人)の単語の共起がみられた. この結果より,以前の段落Pと段落Aの方がより段落間の内容が似通っていると判断し, 段落Aが先にくると推定したと思われる.



平成27年3月4日