next up previous contents
Next: 入力に過去の発話を含まない学習データの出力結果評価 Up: 実験結果 Previous: 出力結果   目次

応答精度評価

評価は各手法の出力をテストデータから抽出した200文で行った. 今回の実験では,過去の発話を含むデータ,含まないデータの両方とも, 入力より前の文脈(データ)を見ずに評価し,必要であれば入力より前の文脈を出力に都合の良いように補完する. 大きく分けて,○は極端な補完無く評価可能且つ適切な応答,△は一部不適切だが文脈に沿う意図が読み取れる応答, ×は不適切な応答であるが,それだけでの評価は困難であるため,更に詳細な評価基準を定めた. また,評価例を表6.3.1に示す.


表 6.3.1: 評価例
評価理由 入出力
○ : 現状の発話応答で正しく完結している 発話:こんにちは 夏 と いえ ば スイカ だ ね
応答:スイカ は 大好き です ね
△ : 応答として適切だが会話の進展が無い 発話:奥 が 深い です ね
応答:はい
△ : 意図が理解可能な範囲で期待する内容 発話:スポーツ は なさい ます か ?
からずれた返答 応答:スポーツ は 必要 です
△ : 会話として適当なオウム返し 発話:マスクメロン は 美味しい です ね
応答:美味しい です ね
$\times$ : 会話として適当で無いオウム返し,相 発話:沖縄 いつ 行く の ?
応答:沖縄



Subsections
next up previous contents
Next: 入力に過去の発話を含まない学習データの出力結果評価 Up: 実験結果 Previous: 出力結果   目次
2018-02-28