next up previous
次へ: 生成確率によるアクセント句境界の位置の持つ情報量の値 上へ: アクセント情報の情報量の値の信頼性 戻る: アクセント情報の情報量の値の信頼性

実験方法の問題点

本報告で使用したアクセント情報の持つ情報量の計算方法は、誤差 がはいる要因を3種類持っている。

  1. 文と文節

    この実験では、入力単位を文にしたとき大量の漢字かなまじり文 が生成されるため、文節を入力単位とした。したがって文と文節に おいてアクセント情報の情報量の差はないと仮定した。

  2. 漢字韻律変換

    漢字韻律変換は、漢字かなまじり文を、必ず正し い音韻情報およびアクセント情報に変換すると仮定した。

  3. 音韻漢字変換

    音韻漢字変換において変換方法として文節数最小法を用いた。こ の変換方法を使用したとき、出力される漢字かなまじり文の数は大 幅にかわる。このため、アクセント情報の情報量の計算値が変動す る可能性がある。ここでは50文節の平均を取ることにより、変動は 無視できると仮定した。



Jin'ichi Murakami 平成13年10月5日