next up previous
次へ: かな漢字変換におけるViterbiアルゴリズム 上へ: マルコフモデルを利用したかな漢字変換方法 戻る: 一般的なかな漢字変換

マルコフモデルを利用したかな漢字変換方法

本論文で提案するかな漢字変換方式は、変換処理(B)において 単語候補の中から漢字かなのマルコフモデルにおいて出現確率が最 大になる漢字かなまじり文を選択し、かな漢字変換結果とするもの である。

例として「おおくらしょうは」が入力され、切り出し処理におい て図2のような単語候補が生成されたとする。変換処理(B)は、 図中の単語候補の組み合わせ(2$\times$3$\times$2)12通りの漢字 かなまじり文の中から、漢字かなのマルコフモデルにおいて出現確 率が最大になる、1つの漢字かなまじり文を選択する。

この場合、漢字かなまじり文``大蔵商は''の出現確率は、漢字かな の1重マルコフモデルにおいては次のように計算される。

P{``大蔵商は''}=P(``大''$\mid$start)$\times$P(``蔵''$\mid$``大'') $\times$P(``商''$\mid$ ``蔵'')$\times$P(``は''$\mid$ ``商'') $\times$P(end$\mid$ ``は'')

ただしP(``蔵''$\mid$ ``大'')は ``大''の漢字の後に ``蔵''の 漢字が続く連鎖確率である。このような出現確率を ``大蔵省は'' ``大蔵しょうは''など12通りの全ての組み合わせの漢字かなまじり 文に対して計算する。そして、このうち確率のもっとも高い漢字か なまじり文を選択し、かな漢字変換結果とする。この結果 ``大蔵 省は''が選択されることが期待される。

図 2: 単語候補(入力 「おおくらしょうは」)
\begin{figure}\begin{center}
\begin{tabular}{\vert l\vert c\vert c\vert}
\hline
...
...\\
& しょう & \\
\hline
\end{tabular}\end{center}\vspace{-5mm}
\end{figure}




平成15年9月30日