next up previous
次へ: 漢字韻律変換を利用したアクセント情報の持つ情報量 の測定方法 上へ: アクセント情報の持つ情報量の基本的な測定方法 戻る: 基本的な測定方法

基本的な測定方法のフローチャート

図1にアクセント情報の持つ情報量の基本的な測定方法を示す。例 文として``私は牡蛎を投げた。''を用いて説明する。

音声認識システムが音韻情報を完全に認識したとして、まず初めに、 韻律情報を用いずに音韻情報から漢字かなまじり文を生成する。こ の例文の場合の音韻情報は``ワタシワカキオナゲタ''である。音韻 情報から漢字かなまじり文に変換するとき、日本語では同一の読み に対し複数の漢字が存在するため、大量の漢字かなまじり文が生成 される。この例文では``私は牡蛎を投げた。''、``私は柿を投げた。''、 ``私は火器を投げた。''、``私、若木を投げた。''などが生成され る。

次に、音声認識システムが音韻情報をに完全に認識し、韻律情報も 与えられたと仮定して、この音韻情報およびアクセント情報から漢 字かなまじり文を生成する。この例文では、音韻情報およびアクセ ント情報は``ワタシワ_^ カキオ_^ ナゲタ''として 与えられる。ここで``^ ''はアクセント核の位置を示し、 ``_''はアクセント句境界の位置を示す。日本語では、アクセント 情報が加わっても複数の漢字かなまじり文が生成されるが、この数 は音韻情報から生成された漢字かなまじり文の数よりも少なくなる。 この例文では``私は牡蛎を投げた。''、``私は火器を投げた。''な どが生成される。

最後に、この両者の漢字かなまじり文の数の比を計算する。音韻情 報から生成される漢字かなまじり文の数と、音韻情報およびアクセ ント情報から生成される漢字かなまじり文の数の差は、アクセント 情報の持つ情報に起因する。したがって、この比がこのような定義 に基づくアクセント情報の持つ情報量となる。

\begin{figure}\begin{center}
\fbox{\epsfile{file=figure1.eps,width=75mm}}\end{center}\end{figure}



Jin'ichi Murakami 平成13年10月5日