next up previous
次へ: Ergodic HMMを用いた形態素解析 上へ: main7 戻る: main7

はじめに


形態素解析は、従来から対話、翻訳、校正などの目的のために、自 然言語処理研究の一つの分野として研究が続けられている。これら の方式の多くは、予め単語を構文的意味的なカテゴリに分類してカ テゴリー間の接続ルールや係受けルールを記述しておく必要がある [1]。しかし、実際の日本語では単語の境界が明確でない ことや単語の多品詞性や曖昧な係受けなどの問題があるため、精密 なルールの作成は容易でない。

そこで、本論文では隠れマルコフモデル(HMM)を用いた日本語の形 態素解析方法を提案する。HMMにはBaum-Welchの学習アルゴリズム が知られているためテキストデータからモデルのパラメータが学習 できる。そのため、文法としてのルールも品詞ラベルが振られたテ キストデータが与えられなくても形態素解析ができる可能性がある。

最後にこのモデルに基づいて実験を行なった。ここで用いたモデル は、かなり単純なモデルであるが、実験の結果は、単純なモデルと しては良好な解析結果を得た。




平成15年9月30日