次に,モデル化の方法を説明する. まず,文末表現の認定条件を以下に示す.
次に,文末表現は多様であるため,文末表現を構成する任意の3文字に注目し, コメントと返事のブロック対から3文字対を全通り抽出する.そして,その対の頻度を求める.
ここで,2つの3文字列
,
がコメント-返事のブロック対に出現した回数を返す関数を
とする.
と
がコメント-返事のブロック対に出現しやすく,逆に
と
がコメント-返事のブロック対に出現しにくいことを表す関数
を
次式で定義する.
(3.3) |
コメント文末 | 返答文末 | スコア |
めでと | ありが | 4.330733 |
おめで | ありが | 4.330733 |
めでと | りがと | 4.317488 |
… | … | … |
んばん | おはよ | 3.583516 |
めでと | うござ | 3.583519 |
でとう | うござ | 3.540959 |
… | … | … |
ですね | ますm | 2.833213 |
すね! | www | 2.833213 |