next up previous contents
Next: 単語単位の情報抽出との比較 Up: 実験 Previous: 実験結果   目次


情報抽出の評価

5.3よりF値を求め,情報抽出の性能を評価する.式中の「列の項目名を中心とする文」の例を表5.3に示す. 表5.3の2,3行目の文は項目名「画素」を中心とする文であるが,4行目は,項目名「画素」を中心とする文ではないので,列の項目名を中心とする文ではないと判断した.実際に列20の適合率と再現率の評価を行った結果を表5.4に示す. 無作為に抽出した5列の評価結果は表5.5のようになった.また,重要度の高い上位5列の評価結果は表5.6のようになった.

\begin{displaymath}
適合率 = \frac{列の項目名を中心とする文の数}{列に含まれる文の数}
\end{displaymath} (5.1)


\begin{displaymath}
再現率 = \frac{列の項目名を中心とする文の数}{列の項目名を中心とする文書中の文の数}
\end{displaymath} (5.2)


\begin{displaymath}
F値 = \frac{2×適合率×再現率}{適合率+再現率}
\end{displaymath} (5.3)


表 5.3: 列の項目名を中心とした文の例
  画素
文書1 メインカメラは約1640万画素○
文書2 カメラ画素数は500万画素○
文書3 多くの光を集めることでより画質のよい写真を撮影できる$\times$


表 5.4: 列20の適合率・再現率の評価結果
\scalebox{0.7}{
\begin{tabular}{\vert c\vert\vert p{16zw}\vert c\vert p{16zw}\...
...}{c\vert}{16} & 9 & \multicolumn{1}{c\vert}{14} \\ \hline
\par
\end{tabular}
}



表 5.5: 無作為に抽出した5列の評価結果
\scalebox{0.9}{
\begin{tabular}{\vert c\vert c\vert c\vert c\vert c\vert c\ver...
...ne
F値 & 0.96 & 0.79 & 0.62 & 0.60 & 0.69 & 0.73 \\ \hline
\end{tabular}
}



表 5.6: 上位5列の評価結果
\scalebox{0.9}{
\begin{tabular}{\vert c\vert c\vert c\vert c\vert c\vert c\ver...
...ne
F値 & 0.98 & 0.96 & 0.93 & 0.75 & 0.81 & 0.89 \\ \hline
\end{tabular}
}




2018-03-02