基本的な測定方法のフローチャート

次へ: 漢字韻律変換を利用したアクセント情報の持つ情報量の測定方法 上へ: アクセント情報の持つ情報量の基本的な測定方法 戻る: 基本的な測定方法

基本的な測定方法のフローチャート

図１にアクセント情報の持つ情報量の基本的な測定方法を示す。例文として``私は牡蛎を投げた。''を用いて説明する。

音声認識システムが音韻情報を完全に認識したとして、まず初めに、韻律情報を用いずに音韻情報から漢字かなまじり文を生成する。この例文の場合の音韻情報は``ワタシワカキオナゲタ''である。音韻情報から漢字かなまじり文に変換するとき、日本語では同一の読みに対し複数の漢字が存在するため、大量の漢字かなまじり文が生成される。この例文では``私は牡蛎を投げた。''、``私は柿を投げた。''、 ``私は火器を投げた。''、``私、若木を投げた。''などが生成される。

次に、音声認識システムが音韻情報をに完全に認識し、韻律情報も与えられたと仮定して、この音韻情報およびアクセント情報から漢字かなまじり文を生成する。この例文では、音韻情報およびアクセント情報は``ワタシワ＿＾カキオ＿＾ナゲタ''として与えられる。ここで``＾ ''はアクセント核の位置を示し、 ``＿''はアクセント句境界の位置を示す。日本語では、アクセント情報が加わっても複数の漢字かなまじり文が生成されるが、この数は音韻情報から生成された漢字かなまじり文の数よりも少なくなる。この例文では``私は牡蛎を投げた。''、``私は火器を投げた。''などが生成される。

最後に、この両者の漢字かなまじり文の数の比を計算する。音韻情報から生成される漢字かなまじり文の数と、音韻情報およびアクセント情報から生成される漢字かなまじり文の数の差は、アクセント情報の持つ情報に起因する。したがって、この比がこのような定義に基づくアクセント情報の持つ情報量となる。

$\begin{figure}\begin{center} \fbox{\epsfile{file=figure1.eps,width=75mm}}\end{center}\end{figure}$

Jin'ichi Murakami 平成13年10月5日