next up previous contents
次へ: 情報タグ候補の作成方法 上へ: 法則ページ抽出方法 戻る: 法則内容抽出   目次


法則内容の分割

Wikipediaから抽出した法則内容をセクション名の個所で文章を分割し、 分割された文章の各部分を、各セクションの文章として抽出する. 冒頭のセクションにはセクション名が存在しないため,タイトルで分割を行う. 分割前のWikipediaの例を図[*],分割後の例を図[*]に示す.
図: 分割前データ
\begin{figure}\begin{center}
\begin{tabular}{\vert l\vert}
\hline
\verb\vert<\...
...t<\Vert page\verb\vert>\vert \\
\hline
\end{tabular} \end{center}\end{figure}
図: 分割後データ
\begin{figure}\begin{center}
\begin{tabular}{\vert l\vert}
\hline
\verb\vert<\...
...短経路における辺数を距離 ……\\
\hline
\end{tabular} \end{center}\end{figure}


平成23年3月2日