次へ:
ダウンロード
上へ:
honron
戻る:
提案システムの環境
目次
Webドキュメントの収集・前処理部
第4章では,図
4
に示す構成のうち,Webドキュメント収集・前処理部 における対象や方法について述べる.
4.1
ではダウンロード,
4.2
で は文抽出,
4.3
では形態素解析についてそれぞれ述べる.
Subsections
ダウンロード
収集の対象
登録サイトリストの作成
収集方法
wgetによるサーバへの負担
ファイル管理
収集結果
文抽出
方法
文抽出の結果
文抽出例
形態素解析
方法
形態素解析の結果
解析例
平成21年3月23日