next up previous contents
次へ: 文抽出の結果 上へ: 文抽出 戻る: 文抽出   目次

方法

収集したHTMLから文抽出を行う.文抽出では,プログラムにより改行<BR>タグま たは句点を文の区切りとして文章を分割する.また,その他のHTMLタグは削除す る.



平成21年3月23日