今回は学習データとして, Wikipediaの全1,061,375記事を使用した.学習データは前処理としてアルファベットとカタカナは全角に,英数字は半角に統一した.学習データの例を表4.3.1に示す.また,単語ベクトルの次元数は300次元とした.