抽出した人名と分野名の例を20件ずつ表,表に示す. この例は, = 0.5のものである.
人名A(後輩) | 人名B(先輩) |
村上仁一 | 池原悟 |
馬青 | 井佐原均 |
宮尾祐介 | 辻井潤一 |
関根聡 | 井佐原均 |
丸山岳彦 | 柏岡秀紀 |
黒田航 | 井佐原均 |
河原達也 | 駒谷和範 |
石川徹也 | 藤井敦 |
難波英嗣 | 奥村学 |
松吉俊 | 佐藤理史 |
竹内孔一 | 影浦峡 |
橋本力 | 奥村学 |
松本忠博 | 伊佐治和哉 |
土屋雅稔 | 佐藤理史 |
高村大也 | 奥村学 |
乾孝司 | 乾健太郎 |
酒井浩之 | 増山繁 |
風間淳一 | 辻井潤一 |
浅原正幸 | 松本裕治 |
松尾義博 | 白井諭 |
実験により抽出した人名277件中の20件を表に示している. 全データより抽出された人名すべてで実験を行ったわけではなく, ルーツとなる人名が出現するデータを確保するため,人名Aとして, 以下の二つの条件を両方とも満足したものを用いて,ルーツである人名を特定した.
この2つの条件を満たした人名は555件であり,この半数の277件を人名Aとして利用し,ルーツを特定する実験を行った.
表の第1列目に示す人名A(後輩)がルーツを特定したい人名であり, 第2列に示す人名B(先輩)が提案手法を用いて特定したルーツであり,人名Aの先輩と予測される人名である.
分野名A | 分野名B(ルーツ) |
自動評価 | 機械翻訳 |
統計的機械翻訳 | 統計 |
サンプリング | コーパス |
タグ付きコーパス | コーパス |
音声対話システム | 音声対話 |
語義曖昧性解消 | 曖昧性解消 |
翻訳自動評価 | 機械翻訳 |
情報分析 | 分析 |
言語横断情報検索 | 情報検索 |
論文要約 | 情報抽出 |
質問応答システム | 数量表現 |
自動構築 | コーパス |
マイニング | コーパス |
表現抽出 | 抽出システム |
文抽出 | 抽出システム |
識別 | 自動獲得 |
重要文抽出 | 抽出システム |
固有表現抽出 | 表現抽出 |
文書要約 | GDA |
テキスト分類 | SVM |
実験により抽出した人名94件中の20件を表に示している. 全データより抽出された分野名すべてで実験を行ったわけではなく, 人名の実験の場合と同様の条件を持つ分野名は187件であり,この半数の94件のみを使用して, 分野名Aとして,ルーツを特定する実験を行った.
表の第1列目に示す分野名Aがルーツを特定したい分野名であり, 第2列に示す分野名B(ルーツ)が提案手法を用いて特定したルーツであり,分野名Aのルーツと予測される分野名である.