next up previous contents
Next: クラスタリング Up: 実験環境 Previous: 実験データ   目次

mecab

本研究ではword2vecのクラスタリングを使用する.word2vecの入力データでは,記事の文章の単語の境目に空白を入れる必要がある.そこで単語ごとに空白をいれるために「mecab」の分かち書きを使用する.以下の図4.2が分かち書き前のものであり,図4.3が分かち書き後のものである.
図 4.2: Wikipediaの記事にmecabを使用する前の例
2#2

図 4.3: Wikipediaの記事にmecabを使用した結果の例
2#2



akano hokuto 2018-03-06