クロスバリデーションでの正解率が約0.83であった類義語「場合」「時」「際」の新聞データを学習データとし,Webデータをテストデータにして実験を行った.表6.5に新聞データでのデータ数とクロスバリデーションでの正解率の結果を示す.
表6.6にWebデータでのデータ数と新聞データを学習データとした時の元の文章の正解率を示す. 正解率が0.71という推定結果となった.同様に表6.6の結果を誤り訂正として考察した.
表6.3に.機械の出力と元の文の語が異なっている文の出力例を示す.出力の形式は「機械が出した答え,○か×,元の文の語, ....@元の文」となっている.
「おかげ」「せい」「ため」の実験と同様に機械の出力のように訂正する場合より,元のWebの文章のほうが正しいことがほとんどであり,この実験はうまく行かなかった.