次へ:
概要
目次
概要
目次
表一覧
図一覧
はじめに
関連研究
順序推定に用いる手法が本研究と異なる関連研究
順序推定の推定対象が本研究と異なる関連研究
用いる文章が本研究と異なる関連研究
素性が本研究と異なる関連研究
問題設定
提案手法
順序が不明な2段落の順序推定の方法
機械学習法
SVM
法
データ作成
提案手法に用いる素性
a1:段落内に出現する品詞とその単語
a2:段落内各文において,助詞「は」で文を区切り,その前部・後部で出現する品詞とその単語
a3:段落内文頭に連体詞や接続詞が出現するか否か
a4:段落内に日付けが出現するか否か
a5:1段落目と2段落目に出現する名詞が一致した数
a6:2段落目に出現する名詞の数から1段落目と2段落目に出現する名詞が一致した数で引いた数
a7:素性a6の値と推定する2段落を入れ替えた場合の素性a6の値の2つの差
a12:推定する2段落以前の段落と1,2段落目に出現する名詞が一致した数
a20:1段落目と2段落目に出現する新規単語の数の差
a21:1段落目と2段落目に出現する新規単語の比率
b22:1段落目の最後の文に出現する単語と2段落目の最初の文に出現する単語の一致した数
b23:素性b22の値と推定する2段落を入れ替えた場合の素性b22との比率
b24:段落内の単語の出現位置を用いた場合における1段落目に出現する単語と2段落目に出現する単語の一致した数
b25:素性b24の値と推定する2段落を入れ替えた場合の素性b24の値との比率
b26:以前の段落の最後の文に出現する単語と推定する各段落の最初の文に出現する単語の一致した数
b27:素性b26の値の比率
b28:以前の段落に出現する単語と推定する各段落に出現する単語の一致した数
b29:素性b28の値の比率
比較手法
実験
実験条件
入力データの種類
1.記事内の最初の2段落のみを用いる場合
2.記事内のあらゆる連接する2段落を用いる場合(Case2)
3.記事内全てから2段落を用いる組み合わせの対の順序を推定する場合(Case3)
実験結果
実験1.素性拡充前と素性拡充後の提案手法と比較手法による順序推定の比較
実験2.素性拡充前と素性拡充後の提案手法と比較手法と人手推定の比較
素性拡充後が正解だった例
素性拡充後が不正解だった例
実験の考察
SVM
分離平面との距離に基づく素性分析
手法
1.学習データで用いた個々の素性の1個のみの事例を持つテストデータを作成
2.1で用いた学習データを用いて1で作成したテストデータ内の全ての事例を
SVM
により分類
3.2において,
SVM
で分類する際に各事例に対する分離平面との距離が算出される
4. 3で得られた分離平面との距離により,分離平面との距離が大きい事例を段落の順序推定に有用な可能性の高い素性とする
4で得られた有用な可能性の高い素性を人手により検討する
実験条件
実験結果
素性分析の考察
追加実験
段落間の隣接する近辺の細かな情報の類似性による推定法
はじめに
推定方法
実験条件
実験結果
実験の考察
小説を用いた段落の順序推定
はじめに
問題設定
提案手法
提案手法に用いる素性
実験条件
実験結果
実験の考察
今後の課題
機械学習に基づく段落の順序推定における素性の拡充
小説を用いた段落の順序推定
上記以外
おわりに
謝辞
参考文献
この文書について...
平成27年3月4日