F値が低いの原因

[*]を見ると,野球チームのF値の評価結果が低い. その原因は同じ種類のデータが同いクラスターに分類されていない.野球チームデータの実験で生成されたテーブルの一部を表[*]と表[*]に示す.実験で生成されたテーブルを見ると,列1と列3が同じクラスターに分類するのはずである.データの詳細を見ると,列1は野球チームの傘下に関する情報である.列3も野球チームの傘下に関する情報であるが,「A級チーム」などの情報もある.単語を間違って分割するのがデータが上手くクラスタリングされていないのは原因と考えられる.列2と列4のデータも同じクラスターに分類するのはずであるが,実験で生成されたテーブルには同じクラスターに分類されていない.実験で決めたクラスター数が最適なクラスター数より多いのが原因と考えられる.


Table: 野球チームの出力テーブル(1)
\scalebox{1.0}{
\begin{tabular}{\vert l\vert p{3cm}\vert p{3cm}\vert p{3cm}\vert...
...級チーム&パシフィック・コーストリーグ\\ \hline
\end{tabular}}



Table: 野球チームの出力テーブル(2)
\scalebox{1.0}{
\begin{tabular}{\vert l\vert p{3cm}\vert p{3cm}\vert p{3cm}\vert...
...AA級チーム&\\ \hline
文書20&&&傘下チーム&\\ \hline
\end{tabular}}