文章レベルでの実験結果について

データ1を正解データ,データ2を実験データとした時のカバー率とデータ2を正解データ,データ1を実験データとした時のカバー率がそれぞれ0.13,0.11と共に低い結果となった.文章の場合は,文が長くなる程複雑化し,他の文章と構成も異なってくるため,このような結果となった.

人手で確認し,比較的良かったテンプレートの例を図6.1にて示す.変数については,表5.2.1の左端の列に含まれる文字列をX0とし,そこから順にX1,X2...と表5.2.2の右端の列(X10)まで置いている.図6.1に示すテンプレートでは,文毎に情報が分かれており,それぞれ別のクラスタとして適切にクラスタリングされているため,テンプレートも変数がそれぞれ別になっている.また,「X0はタイトル」,「X3は概要文」などこのテンプレートが持つ情報通りに「X0。X3。X4。X7。X1。X6。X2。」として変数に適切な文字列を補完すれば比較的流暢で様々な文章が生成可能なため,有用なテンプレートと考える.

Figure 6.1: 文章レベルのテンプレートの良かった例
73#73  

次に,図6.2にて比較的悪かった例を示す.文毎に情報が異なっているがクラスタリングが適切にされず,X0以外が全て1つのクラスタとなっている.そのためテンプレートも「X0。X8。X8。X8。X8。」となりX8が持つ情報が重複しているため,ここから文生成を行う場合,どの情報を変数に補完するべきか分からず,比較的悪いテンプレートである.

Figure 6.2: 文章レベルのテンプレートの悪かった例
74#74