next up previous contents
Next: 店名の抽出が完全である場合の追加実験 Up: 考察 Previous: 言語解析力の問題   目次

店名の抽出が不完全である問題

適合率,再現率が低い主な原因としては,場所名の抽出はMeCabの形態素解析に よる地域名を利用しているため,人手の正解データで使用される「店名」や一部の「場所名」 が抽出できないことが挙げられる.

例として,図6.3のレス22では場所名として 「店名」である「阪神百貨店」が使用されている.こうした例は多数みられたため, 場所名の抽出を改善すれば適合率,再現率は向上すると考えられる.

6.4に実際にMeCabによる出力を示す. MeCabによる出力では「地域」とは出力されず,「組織」と出力される.

図 6.3: 店名
\begin{figure}\begin{center}
{\small
\begin{tabular}{l}
\hline
22 :名無し...
...品として売ってるよ\\
\hline
\end{tabular}}
\end{center}
\end{figure}

図 6.4: MeCabによる出力
\begin{figure}\begin{center}
{\footnotesize
\begin{tabular}{l}
\hline
阪神百...
...形,やく,ヤキ,ヤキ\\
\par
\hline
\end{tabular}}
\end{center}
\end{figure}



2013-02-23