次へ: Ergodic HMMを用いた形態素解析 上へ: main7 戻る: main7

はじめに

形態素解析は、従来から対話、翻訳、校正などの目的のために、自然言語処理研究の一つの分野として研究が続けられている。これらの方式の多くは、予め単語を構文的意味的なカテゴリに分類してカテゴリー間の接続ルールや係受けルールを記述しておく必要がある [1]。しかし、実際の日本語では単語の境界が明確でないことや単語の多品詞性や曖昧な係受けなどの問題があるため、精密なルールの作成は容易でない。

そこで、本論文では隠れマルコフモデル(HMM)を用いた日本語の形態素解析方法を提案する。HMMにはBaum-Welchの学習アルゴリズムが知られているためテキストデータからモデルのパラメータが学習できる。そのため、文法としてのルールも品詞ラベルが振られたテキストデータが与えられなくても形態素解析ができる可能性がある。

最後にこのモデルに基づいて実験を行なった。ここで用いたモデルは、かなり単純なモデルであるが、実験の結果は、単純なモデルとしては良好な解析結果を得た。

平成15年9月30日