next up previous contents
Next: 情報抽出の比較 Up: 実験結果 Previous: クラスタリングを用いた情報抽出の結果   目次

類似度を用いた情報抽出の結果

本節はクラスタリングを行った結果から「城」と類似度の高い単語以外を削除して情報抽出を行った.各クラスタには関係のない単語が混ざっていることが多く,「城」と類似度が高い単語以外を削除すると,関係のない単語を削除できるのではないかと考えて行ったものである.例として表5.11 のクラスタにおいて「城」と類似度の高い単語以外を削除した結果を表5.12に示す.「城」と関係のない単語が削除された.また,クラスタ407 では「ニノ」や「薬」などクラスタと関係のない単語を削除することができた.しかし,「救援」や「惨敗」などの重要情報である単語が多く削除されているクラスタが多かった.このため,本研究では類似度に基づく単語の削除は行わないことにした.


表 5.11: 類似度削除前のクラスタ401
おびき出し,ひい,引き返し,援軍 ,炎上 ,加わっ ,壊滅 ,開城
勧告,陥落,頑強,奇襲,喫し,救援,窮地,屈服,迎え撃つ ,向かわ
抗戦,攻める,攻め寄せ,攻め落とす,惨敗,持ちこたえ,銃撃,出撃
出陣,少数,焼か,焼き討ち,焼き払い,焼き払わ,申し入れ,進軍
占拠,全滅,阻止,総崩れ,遭い,態勢,退け,退却,大敗,着陣,駐留
直ぐ,抵抗,撤退,転戦,逃走,派兵,破っ,敗戦,敗走,敗退,敗北
迫り,不完全,伏兵,奮戦,兵糧,放火,防戦,本隊,明け渡し,戻り
夜襲,落ち延びる,落城,篭城


表 5.12: 類似度削除後のクラスタ401
引き返し,援軍 ,開城,陥落,奇襲,喫し,迎え撃つ
攻める,攻め寄せ,攻め落とす,持ちこたえ,出撃
出陣,焼き討ち,焼き払い,焼き払わ,進軍
退却,大敗,着陣,敗走,伏兵,奮戦,兵糧,防戦
本隊,夜襲,落ち延びる,落城,篭城



akano hokuto 2018-03-06