next up previous contents
Next: 評価実験のまとめ Up: 実験結果 Previous: 単語抽出における正解率   目次

F値における記載不足の指摘の評価

6.2.3節で述べた方法で記載不足の指摘の実験を行った.また,先行手法と提案手法で記載不足の指摘を行った結果を比較した.

Wikipedia の城ページにおいて実際に情報が欠落していた項目を,情報抽出の実験 で適切に空欄として検出できると,記載不足の指摘が適切に行えたと考える. 空欄箇所に基づく情報の欠落項目の検出性能を再現率,適合率,F 値で評価した.そ の結果を表 6.13に示す.


表 6.13: 文章作成支援の結果の評価
20#20


再現率はWikipedia内に正解の記載がなかったもののうち,正しく空欄を抽出できた場合に正解とする. また,重要項目の単語がWikipediaのページに表記されていない場合に,表の箇所に間違えて単語を抽出した場合は不正解とする.例としては,提案手法「分類語彙表」の城ページ番号6の重要項目「戦い」で「議論(×)」となっている.城ページ番号6のページで重要項目「戦い」に関連する単語は表記されていないが「議論」が間違えて抽出された.このような場合不正解とする.

適合率は表抽出において空欄となった場所が正しく空欄とした場合正解とする. また,城ページにおいて重要項目の単語の表記されている表の箇所に間違えて空欄を検出した不正解とする.例としては,先行手法の城ページ番号1の重要項目「交通」で×となっている.しかし,城ページ番号1のページでは交通に関連する地名の「京都」が表記されていた.このように重要項目に関する単語が城ページに表記されているが,空欄と検出した場合は不正解とする.

F値を評価した結果,先行手法のF値は0.77となり,提案手法「Wikipedia全ページでクラスタリング」のF値は0.75となり,提案手法「類似度」のF値は0.84となり,提案手法「分類語彙表」のF値は0.81となった.このように,提案手法「類似度」,「分類語彙表」の方が先行手法と提案手法「Wikipedia全ページでクラスタリング」より精度が高い結果になった.提案手法「Wikipedia全ページでクラスタリング」が低かった原因としては,重要項目「交通」の単語をあまり抽出できなかったことで適合率が低くなってしまったことが挙げられる.1つのクラスタを重要項目としているため,移動手段の方法や地名といった単語は別のクラスタに属する単語を抽出することが出来ず,単語の網羅性が低かったことが原因だと考えられる.



akano hokuto 2018-03-06