next up previous contents
Next: 店名の抽出が不完全である問題 Up: 過剰な3つ組が生成される問題 Previous: 集約による3つ組の増大する問題   目次

言語解析力の問題

「商品名」,「場所名」,「評価情報」を抽出する際,全ての組み合わせで3つ 組を作成するため,1つのレスに複数の情報が存在する場合3つ組が大量に作成さ れてしまう.

別のテストセットより,典型的な例を図6.3に示す.

図 6.2: 複数記述例
\begin{figure}\begin{center}
{\small
\begin{tabular}{l}
\hline
1 :名無しさ...
...\
高知って何かある?\\
\hline
\end{tabular}}
\end{center}
\end{figure}


表 6.2: 大量な3つ組の具体例
レス番号 3つ組情報
1 ($ \phi$ , 四国, $ \phi$ )
2 ($ \phi$ , 八重山, $ \phi$ )
3 (うどん,徳島, $ \phi$ );(うどん,鳴門, $ \phi$ );(うどん,香川, $ \phi$ );(うどん, 愛媛, $ \phi$ );
(うどん,高知, $ \phi$ );(うどん, $ \phi$ , $ \phi$ );(カツオ,徳島, $ \phi$ );(カツオ,鳴門, $ \phi$ );
(カツオ,香川, $ \phi$ );(カツオ,愛媛, $ \phi$ );(カツオ,高知, $ \phi$ );(カツオ, $ \phi$ , $ \phi$ );
(スダチ,徳島, $ \phi$ );(スダチ,鳴門, $ \phi$ );(スダチ,香川, $ \phi$ );(スダチ,愛媛, $ \phi$ );
(スダチ,高知, $ \phi$ );(スダチ, $ \phi$ , $ \phi$ );(タルト,徳島, $ \phi$ );(タルト,鳴門, $ \phi$ );
(タルト,香川, $ \phi$ );(タルト,愛媛, $ \phi$ );(タルト,高知, $ \phi$ );(タルト, $ \phi$ , $ \phi$ );
(和三盆,徳島, $ \phi$ );(和三盆,鳴門, $ \phi$ );(和三盆,香川, $ \phi$ );(和三盆,愛媛, $ \phi$ );
(和三盆,高知, $ \phi$ );(和三盆, $ \phi$ , $ \phi$ );(和三盆糖,徳島, $ \phi$ );(和三盆糖,鳴門, $ \phi$ );
(和三盆糖,香川, $ \phi$ );(和三盆糖,愛媛, $ \phi$ );(和三盆糖,高知, $ \phi$ );(和三盆糖,, $ \phi$ );
(坊ちゃん団子,徳島, $ \phi$ );(坊ちゃん団子,鳴門, $ \phi$ );(坊ちゃん団子,香川, $ \phi$ );
(坊ちゃん団子,愛媛, $ \phi$ );(坊ちゃん団子,高知, $ \phi$ );(坊ちゃん団子, $ \phi$ , $ \phi$ );
(金長饅頭,徳島, $ \phi$ );(金長饅頭,鳴門, $ \phi$ );(金長饅頭,香川, $ \phi$ );(金長饅頭,愛媛, $ \phi$ );
(金長饅頭,高知, $ \phi$ );(金長饅頭, $ \phi$ , $ \phi$ );(鳴門金時,徳島, $ \phi$ );(鳴門金時,鳴門, $ \phi$ );
(鳴門金時,香川, $ \phi$ );(鳴門金時,愛媛, $ \phi$ );(鳴門金時,高知, $ \phi$ );(鳴門金時,, $ \phi$ );
($ \phi$ ,徳島, $ \phi$ );($ \phi$ ,鳴門, $ \phi$ );($ \phi$ ,香川, $ \phi$ );($ \phi$ ,愛媛, $ \phi$ );($ \phi$ ,高知, $ \phi$ )

レス3において人による理想的な3つ組では一行単位で3つ組を作成することで, 過剰な3つ組の作成を抑えることが可能であるが,全ての組み合わせの場合は3つ 組が大量に作成されてしまう.


next up previous contents
Next: 店名の抽出が不完全である問題 Up: 過剰な3つ組が生成される問題 Previous: 集約による3つ組の増大する問題   目次
2013-02-23