実験データ

**Figure:** 処理結果の例
$\begin{figure}\begin{center} \begin{itembox}[l]{地震の文章の例} \small$... ...r $<$/doc$>$ \end{itembox} %\label{bunkatu_result} \end{center} \end{figure}$

**Table:** 地震での正解テーブル
**Table:** 地震での正解テーブル
$\scalebox{0.9}{ \begin{tabular}{\vert l\vert p{13cm}\vert} \hline 文書番号�... ...��される \\ \hline 文書10　　&\\ \hline ... &... \\ \hline \end{tabular}}$ $\scalebox{0.9}{ \begin{tabular}{\vert l\vert p{10cm}\vert l\vert} \hline 文書�... ... \\ \hline 文書10　　 & &...\\ \hline ... &... &... \\ \hline \end{tabular}}$

文書データの詳細を以下で示す.

**Table:** 文書データの詳しいの表
$\scalebox{1.0}{ \begin{tabular}{\vert l\vert r\vert r\vert r\vert} \hline 記事... ...31.5 \\ \hline Wikipedia(野球チーム) &20 &68 &46.9 \\ \hline \end{tabular}}$

1.入力データ:強盗事件に関する新聞記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新聞記事の詳しい:2016年度の毎日新聞から見出しに「強盗:」を含む記事をランダムに20件抽出したデータ.

2.入力データ:地震に関する新聞記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新聞記事の詳しい:2016年度の毎日新聞から見出しに「地震」と「震度」を含む記事をランダムに20件抽出したデータ

3.入力データ:交通事故に関する新聞記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新聞記事の詳しい:2016年度の毎日新聞から見出しに「交通事故:」を含む記事をランダムに20件抽出したデータ

4.入力データ:リコールに関する新聞記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新聞記事の詳しい:2016年度の毎日新聞から見出しに「リコール:」を含む記事をランダムに20件抽出したデータ

5.入力データ:スマートフォンに関する新製品記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新製品記事の詳しい:2018年1月15日時点での「価格.com」のスマートフォンカテゴリーにおける最新の新製品ニュース記事20件を抽出したデータ

6.入力データ:スマートフォンに関する新製品記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新製品記事の詳しい:2018年1月15日時点での「価格.com」の薄型テレビ液晶テレビカテゴリーにおける最新の新製品ニュース記事20件を抽出したデータ

7.入力データ:デジタルカメラに関する新製品記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新製品記事の詳しい:2018年1月15日時点での「価格.com」のデジタルカメラカテゴリーにおける最新の新製品ニュース記事20件を抽出したデータ

8.入力データ:ロボット掃除機に関する新製品記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新製品記事の詳しい:2018年1月15日時点での「価格.com」の掃除機カテゴリーにおけるロボット掃除機に関する最新の新製品ニュース記事20件を抽出したデータ

9.入力データ:エアコンに関する新製品記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
新製品記事の詳しい:2018年1月15日時点での「価格.com」のエアコン・クラーカテゴリーにおける最新の新製品ニュース記事20件を抽出したデータ

10.入力データ:城に関するWikipediaの記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
Wikipediaの記事の詳しい:2017年6月1日時点でのWikiediaのカテゴリー「日本の 100 名城」に含まれる全ページのうち,ランダムに抽出した20記事の要約部を抽出したデータ

11.入力データ:恐竜に関するWikipediaの記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
Wikipediaの記事の詳しい:2017年6月1日時点でのWikiediaのカテゴリー「ジュラ紀の恐竜」に含まれる全ページのうち,ランダムに抽出した20記事の要約部を抽出したデータ

12.入力データ:力士に関するWikipediaの記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
Wikipediaの記事の詳しい:2017年6月1日時点でのWikiediaのカテゴリー「高校相撲部出身の大相撲力士」に含まれる全ページのうち,ランダムに抽出した20記事の要約部を抽出したデータ

13.入力データ:山に関するWikipediaの記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
Wikipediaの記事の詳しい:2017年6月1日時点でのWikiediaのカテゴリー「日本百名山」に含まれる全ページのうち,ランダムに抽出した20記事の要約部を抽出したデータ

14.入力データ:野球チームに関するWikipediaの記事20件に基づき,人手で作った文レベルの正解テーブル(１回目クラスタリングの結果として)
Wikipediaの記事の詳しい:2017年6月1日時点でのWikiediaのカテゴリー「アメリカ合衆国の野球チーム」に含まれる全ページのうち,ランダムに抽出した20記事の要約部を抽出したデータ