next up previous contents
次へ: 情緒研究 上へ: 研究背景と目的 戻る: 研究背景と目的   目次

関根らの研究:WEB文書を対象にしたKWICシステム

WWWデータに関連した研究は過去に関根らが行っている.日本語教育という点に ついて考え,WWWデータからKWICシステムを構築している.WWWデータは不特定多 数の人間が,制限なく書いているという点で利用価値が高いとしている.WWWデー タのような生データの実際の使われ方に基づき,頻度やそのコンテキストの具体 例を利用して教えることは説得力の点で非常に有効であるとしている.WWWデー タの収集方法として,クローラーツールはUNIX上のGNUWgetを利用し,内容に信 頼性よりYahoo!Japanでカテゴライズされているページを起点としている.対象 ファイルは,文書の収集が目的のため拡張子がhtml,htm,txtとする.

KWICシステムとは,``Key Word In Context''のことで,検索キーワードを中心 にその前後の文脈を同時に表示する牽引手法である.インターネットを介し標準 的ブラウザから利用でき,ユーザーがキーワードを入力すると,システムは検索 された行数とサンプルを表示するというものである.

KWICシステムの利用例として,オノマトペの学習がある.日本語教育において難 しい問題であるが,KWICシステムを利用すると具体例が出てきて分かりやすい. 例えば,「胃の痛み」の場合「キリキリ」や「しくしく」などがどういった症状 のとき使用するか具体的な文とし て表示される.よってオノマトペの使用方が学習できる.また,オノマトペに限 らず,形式名詞の「の」と「こと」の使い分けや,特定の単語の結合である連語, 慣用句の使い方の学習などに使用できる.



平成18年5月30日