next up previous contents
Next: おわりに Up: 機械学習を用いた文章の誤り訂正実験と考察 Previous: 「おかげ」「せい」「ため」での実験   目次


「場合」「時」「際」での実験

クロスバリデーションでの正解率が約0.83であった類義語「場合」「時」「際」の新聞データを学習データとし,Webデータをテストデータにして実験を行った.表6.5に新聞データでのデータ数とクロスバリデーションでの正解率の結果を示す.




表 6.5: 「場合」「時」「際」の正解率(新聞データ)
  データ数 再現率
場合 3946 0.88
3450 0.81
2604 0.80
総数 10000 0.83

 

6.6にWebデータでのデータ数と新聞データを学習データとした時の元の文章の正解率を示す. 正解率が0.71という推定結果となった.同様に表6.6の結果を誤り訂正として考察した.




表 6.6: 「場合」「時」「際」の正解率(Webデータ)
  データ数 正解率
場合 1000 0.89
1000 0.66
1000 0.59
総数 3000 0.71

 

6.3に.機械の出力と元の文の語が異なっている文の出力例を示す.出力の形式は「機械が出した答え,○か×,元の文の語, ....@元の文」となっている.


表 6.7: 機械の出力と元の文の語が異なっている文の出力例(「場合」「時」「際」)
\begin{table}\begin{center}
\vspace{4mm}
\scalebox{0.9}{
\fbox{
\begin{mini...
...ち着いて登録しましょう。
\end{minipage}}
}
\end{center}\end{table}


「おかげ」「せい」「ため」の実験と同様に機械の出力のように訂正する場合より,元のWebの文章のほうが正しいことがほとんどであり,この実験はうまく行かなかった.



root 2018-02-28