表を見ると,野球チームのF値の評価結果が低い. その原因は同じ種類のデータが同いクラスターに分類されていない.野球チームデータの実験で生成されたテーブルの一部を表と表に示す.実験で生成されたテーブルを見ると,列1と列3が同じクラスターに分類するのはずである.データの詳細を見ると,列1は野球チームの傘下に関する情報である.列3も野球チームの傘下に関する情報であるが,「A級チーム」などの情報もある.単語を間違って分割するのがデータが上手くクラスタリングされていないのは原因と考えられる.列2と列4のデータも同じクラスターに分類するのはずであるが,実験で生成されたテーブルには同じクラスターに分類されていない.実験で決めたクラスター数が最適なクラスター数より多いのが原因と考えられる.