この手法では句点までで終わる短い文レベルでのテンプレートを生成する.
作成された表に対して,文を全て名詞のみの状態にし再度列ごとでクラスタリングを行い,テンプレートを生成する.2章の方法で生成された表からテンプレート生成までの手順を以下に示す.また,手順の概略を図3.3に示す.
- 手順1
- 生成された表の全文を名詞のみの状態にする.テンプレートを生成するにあたり,本研究では名詞をテンプレートの変数と設定した.表中の文章に対してMeCabで形態素解析を行い,名詞以外の品詞は除去する.
- 手順2
- 名詞のみの状態で列ごとに再度クラスタリングを行う.
- 手順3
- 手順2で生成された表の各列をテンプレートの各変数とする.列の左側から順にX1,X2と設定し,その列に含まれる単語が変数となる.
- 手順4
- 元の文章に対して上記の変数を適応させ,テンプレートを生成する.
Figure 3.3:
文レベルでのテンプレート生成の手順
58#58
|