next up previous contents
次へ: 関連研究と本研究の違い 上へ: 関連研究と本研究の関係 戻る: 関連研究と本研究の関係   目次

関連研究

この節では日本語誤り検出,統一(スペルチェック)に関する研究を説明する.

1章でも述べたが,白木ら[8]は,日本語の中でも平仮名の誤字・脱字に対するスペルチェッカを作成している. 平仮名を対象としているのは,漢字の場合は,かな漢字変換が一種の確認作業となるため誤りが少なく, 一方平仮名は,かな漢字変換では処理されず,誤字・脱字などの単純な入力ミスが多く残る傾向があるためである.

スペルチェックの方法として,まず大量の辞書構築用テキストから平仮名列を抜きだして,ハッシュ等を使用して辞書データベースを作成する. 次にスペルチェック対象テキストから平仮名列のみ抜きだし,辞書データベース中に平仮名列があるかどうかを調べる.なければ誤りの候補としてユーザに示す,という手法である. あらかじめ大量のテキストから抜き出した情報をもとに誤りを探すという点で,本研究と近いと言える.

この他にも日本語誤りを検出する研究は多数あり,高い性能のシステムが提案されている. 以下に,本研究を進める際に参考とした研究をまとめる.

池原ら[1]の文献により,誤りの種類とそれに対する検出技術,実用化されたシステムが紹介されている.

村田ら[2,3]は,正例(positive examples)から負例(negative examples)の予測方法を提案している. 正例から判定する事例の一般的確率を求め,その確率が高いが正例に出現しないものを負例としている. また,日本語誤り検出と外の関係の文の自動抽出を行っており,有効性と汎用性を示している.

近年の研究では,留学生等の日本語学習者を対象とする研究があり,三浦ら[5]の格フレームを用いた助詞修正システムや, 今枝ら[6]の格助詞を対象とした誤り検出と訂正の研究がある.



平成25年10月13日