next up previous
次へ: 予測を利用した音声からの発話理解手法 上へ: 音声対話システムにおける次発話予測の1手法 戻る: ネットワーク文法による文モデルの作成


意味表現bigramによる次発話予測

本稿では対話におけるユーザの一連の意味表現の生起を,1重マルコフ過程と してモデル化し,予測モデルとした.このモデルを意味表現bigramと呼ぶ. すなわち,ある時刻$t$に意味表現$M_t$が出現する確率$P(M_t)$を,意味表 現bigramによる遷移確率 $P(M_t\vert M_{t-1})$によって予測する.

この意味表現bigramは前述の対話データから学習する.しかし,$M_t$ をなす $(ACT_t, ARG1_t, ARG2_t)$ の3つの情報の組み合わせ全てについて,遷移確 率を精度良くを求めるには対話データの量が不足している.そこで2種類の近 似モデルについて検討した.

予測モデルA:(1)式で表され,意味表現中の$ACT$のみについて着目して近似したモデルある.

$\displaystyle {P(M_t\vert M_{t-1})} $
    $\displaystyle \simeq \frac{P(ACT_t\vert ACT_{t-1})}{ACT_t,ARG1_t,ARG2_tの組合せ数}$ (1)

予測モデルB:(2)式で表され,$ARG1$,$ARG2$についての確率を対話データ全体での出現頻度で近似したモデルである.

$\displaystyle {P(M_t\vert M_{t-1}) \simeq P(ACT_t\vert ACT_{t-1})}$
    $\displaystyle \times P(ARG1_t\vert ACT_t)P(ARG2_t\vert ACT_t)$ (2)



Jin'ichi Murakami 平成13年4月17日