next up previous contents
Next: キーワードの抽出の関連研究 Up: 関連研究 Previous: 単語ネットワーク作成の関連研究   目次

Web上のデータを用いた関連研究

松尾[9][5]らは,Webマイニングの技術を用いて,Web上の情報だけから特定のコミュニティ(人工知能学会)の人間関係を自動的に抽出した.検索エンジンを利用して,特定の2者に関係する文書を検索し,そのヒット件数や文書の内容から,関係の強さおよび関係の種類を判断した.その後,人をノード,関係をエッジ,関係の種類をエッジのラベルとしたネットワークを作成し,人間関係を可視化した.

友部[9]らは,Webから抽出した情報を用い,人の関係性をセマンティックWebの枠組みの中で記述できること,得られたネットワークの中心性の解析をすることで,コミュニティにおける著名な人物が分かること,それが信頼性につながる別の尺度と相関していることを示した.セマンティックWebとは,Webページおよびその中に記述された内容について,それが何を意味するかを表す情報を一定の規則に従って付加することで,コンピュータが効率よく情報を収集・解釈できるようにする構想である.セマンティックWebでは,計算機に理解できるRDFなどの形式的な記述の方法を用い,他との関係性を明示的に記述していくことで推論が可能になり,高度な情報検索や問題解決を期待することができる.

Harada[7]らは,トピックのために検索されたWebページから適切な名前を抽出することを提案した.そして,効果的な人の発見方法を探るために約5,000万の日本のWebページを分析して、日本の個人名の分布を調べた.また,Webページの数ではなく,名前を含むWebサーバーの数を利用し,幅広いテーマをカバーする実験により、その有効性を示した.



2017-04-20