next up previous contents
Next: 表生成 Up: Wikipedia以外の実験 Previous: 実験環境   目次

評価方法

先行研究 [8]は重要項目「性別」「年齢」「年代」「職業」「身体的特徴」「性格」を「再現率」と「精度」で評価していた. 「再現率」はあらかじめ人手で作った特徴表の単語が抽出できた割合を示し,「精度」は抽出された単語の正解率で示していた. 本研究では先行研究と同様の評価方法で行う.

提案手法の類似度は「性別」「年齢」「職業」「身体的特徴」「性格」を重要項目と決定し,それぞれ5つの単語との類似度が高い単語を重要項目の単語群とし,5つの重要項目の評価を行う.ただし,先行研究の「年齢」は「17 歳」や「三十五歳」といった歳の年齢を正解としていた.また,提案手法の「年齢」は「少年」や「老人」といった「乳幼児期」「少年期」「青年期」「中年期」「老年期」の特徴を示す単語が抽出された.これらは先行研究の重要項目「年代」に相当する単語である.よって,先行研究の「年代」と提案手法の「年齢」を対応づけて評価する.

提案手法の分類語彙表は分類項目名「男女」に属する単語を重要項目「性別」と定義し,分類項目名「老少」「夫婦」「親・先祖」「子・子…」「兄弟」「親戚」に属する単語を重要項目「年齢」と定義し,分類項目名「社会階…」「人物」「成員」「専門的」「支配的」「販売な」「運輸」「生産工…」「保安サ…」「サービ…」「反社会…」「軍人」「長」「相対的」「臨時的」に属する単語を重要項目「職業」と定義し,分類項目名「動物」「衣服」「雨着」「下着」「袖・衿…」「帽子」「ネクタイ」「はき物」「鏡・レンズ」に属する単語を重要項目「職業」と定義し,分類項目名「安心・…」「対人感…」「表情(…」「声」「自我・…」「自信・…」「欲望・…」に属する単語を重要項目「職業」と定義し評価する.提案手法の類似度と同様に先行研究の「年代」と提案手法の「年齢」を対応づけて評価する.

また,先行研究の実験結果 [8]を利用する.ただし,本実験は「怪人二十面相」の小説データで評価実験を行い,先行研究の評価する小説データとは違うデータで比較する.



akano hokuto 2018-03-06