今回使用するコーパスにおける対話は「発話→応答(と発話)→応答(と発話)・・・」となっている. 応答は次の応答と組み合わせることで発話へ変化するため、表記としては「応答(と発話)」となる. 通常は「発話→応答」のペアに修正し,コーパスとして使用する.
本実験では,発話にその直前の応答を組み合わせ,それを発話データとして用いる. 以下に例を示す.
上記のような対話データを 表4.2.1のように組み合わせ,コーパスを作成する. eosとは会話の区切りを示す記号であり,本実験ではコーパスに単語として含ませる.