next up previous contents
次へ: 評価実験 上へ: sotu4 戻る: 分野名の出力例   目次


抽出実験

言語処理学会年次大会の論文1995年から2010年の3,139件のデータを使用し, 人名と分野名の変遷の対を抽出した.

抽出した人名と分野名の例を20件ずつ表[*],表[*]に示す. この例は,$ a$ = 0.5のものである.


表: 実験で抽出された人名の変遷例
人名A(後輩) 人名B(先輩)
村上仁一 池原悟
馬青 井佐原均
宮尾祐介 辻井潤一
関根聡 井佐原均
丸山岳彦 柏岡秀紀
黒田航 井佐原均
河原達也 駒谷和範
石川徹也 藤井敦
難波英嗣 奥村学
松吉俊 佐藤理史
竹内孔一 影浦峡 
橋本力 奥村学
松本忠博 伊佐治和哉
土屋雅稔 佐藤理史
高村大也 奥村学
乾孝司 乾健太郎
酒井浩之 増山繁
風間淳一 辻井潤一
浅原正幸 松本裕治
松尾義博 白井諭

実験により抽出した人名277件中の20件を表[*]に示している. 全データより抽出された人名すべてで実験を行ったわけではなく, ルーツとなる人名が出現するデータを確保するため,人名Aとして, 以下の二つの条件を両方とも満足したものを用いて,ルーツである人名を特定した.

  1. 現時点で使用できるデータ中で一番古い年のものの3年 (一番古いデータが1995年であれば,1998年)以上後に出現した人名であること.
  2. 全データ中に3回以上出現のあったもの(それ以下の出現回数ではデータ不足とみなし,使用していない)であること.

この2つの条件を満たした人名は555件であり,この半数の277件を人名Aとして利用し,ルーツを特定する実験を行った.

表の第1列目に示す人名A(後輩)がルーツを特定したい人名であり, 第2列に示す人名B(先輩)が提案手法を用いて特定したルーツであり,人名Aの先輩と予測される人名である.


表: 実験で抽出された分野名の変遷例
分野名A 分野名B(ルーツ)
自動評価 機械翻訳
統計的機械翻訳 統計
サンプリング コーパス
タグ付きコーパス コーパス
音声対話システム 音声対話
語義曖昧性解消 曖昧性解消
翻訳自動評価 機械翻訳
情報分析 分析
言語横断情報検索 情報検索
論文要約 情報抽出
質問応答システム 数量表現
自動構築 コーパス
マイニング コーパス
表現抽出 抽出システム
文抽出 抽出システム
識別 自動獲得
重要文抽出 抽出システム
固有表現抽出 表現抽出
文書要約 GDA
テキスト分類 SVM

実験により抽出した人名94件中の20件を表[*]に示している. 全データより抽出された分野名すべてで実験を行ったわけではなく, 人名の実験の場合と同様の条件を持つ分野名は187件であり,この半数の94件のみを使用して, 分野名Aとして,ルーツを特定する実験を行った.

表の第1列目に示す分野名Aがルーツを特定したい分野名であり, 第2列に示す分野名B(ルーツ)が提案手法を用いて特定したルーツであり,分野名Aのルーツと予測される分野名である.


next up previous contents
次へ: 評価実験 上へ: sotu4 戻る: 分野名の出力例   目次
平成25年10月13日