次へ: 関連研究
上へ: aso
戻る: 表一覧
目次
近年,Wikipediaと呼ばれるオンライン百科事典が急速な成長を見せている.
誰もが編集可能であるという特徴を持った事典は,多方面に精通した辞書を得ることに
成功しているが,その中から目的の情報を探すための負担は,情報が増えることに
比例して大きくなっていくため,効率の良い情報収集のための支援が求められている.
Wikipediaでは,記事が章や節で区切られている.
本研究では,その章や節のことをセクションと呼び,セクションに与えられた見出し
をセクション名と呼ぶ.
利用者はセクション名を頼りに情報を絞り,目的の情報を探す.
しかし,セクション名は厳格な基準がなく文章作成者の判断によって決められているため,
統一されたセクション名はつけられていない.また,冒頭のセクションにはセクション名がつけられていない.
そのため利用者は,目的のセクション名を見つけられなかった場合,どのセクションに
必要な情報が書かれているか想定できないため,
そのページのセクション全てをチェックしなければならなくなる.
藤井らの研究[1]では,セクション名に注目してWikipediaから教師データを作成し,
検索した単語の要約を行っているが,他の手法との比較実験は行っていない.
そこで本研究では,
利用者の支援となる情報タグをセクションに付与する方法を提案すると共に,
種々の手法を利用した情報タグ付与を試み,各手法の特徴を明らかにする.
情報タグとは,どのような情報が各セクションに存在するかを示すものである.
Wikipediaの利用者は,情報タグによりどのような情報が
どのセクションに存在しているかを容易に知ることができる.
本論文の構成は以下の通りである.第2章ではこれまでのWikipediaに対する研究を説明し,利用可能なWikipediaの情報を説明する.
第3章では本研究における,情報タグの付与方法と情報付与に利用する技術を説明する.
第4章では,Wikipediaに情報タグの付与を行う.
第5章では,情報タグの付与結果に対する手法ごと,分類ごとの評価を行う.また,
推定教師データを利用したStacking,教師数によるF値の変化を調査することによって,
推定教師データの分析を行う.
第6章で考察を行い推定教師データの効果的な利用法を考察する.
第7章ではまとめを行う.
平成23年3月2日