next up previous contents
次へ: 用いる文章が本研究と異なる関連研究 上へ: 関連研究 戻る: 順序推定に用いる手法が本研究と異なる関連研究   目次

順序推定の推定対象が本研究と異なる関連研究

内元ら[2]は文生成のために, 最大エントロピー法を用いて単語の順序を推定する研究を行った. 日本語の語順の傾向を整理することが 文の解析や生成する際に有効な情報となると考え, 文節内外に含まれる様々な情報から語順の傾向を学習するモデルを用いた. 正しい語順を京大コーパス内での語順とすることにより, 語順に関わる学習データを京大コーパスから自動的に構築でき, 人手での学習データの作成を不要とした. 実際には,京大コーパス内の文節の係り受け情報をもとに 文節を対象とし順序推定を行っており, 語順の傾向を学習するために 文節内外の格要素や活用部分の情報を用いることで, 有効に働くことがわかっている.

林ら[3]は新聞記事から文の順序推定のために, 多数の素性を用いた機械学習に基づく研究を行った. 新聞記事から2文1組で抜き出し, その2文対から元の順序(正例)の文と逆順(負例)の文を作成し, 与えられた事例が機械学習によりどの文が先かを判定して 文の順序推定を行うというものである. 機械学習に用いるデータは内元らの研究を参考にして コーパス(新聞記事)から自動的に構築できるようにした. 実験では, 段落内最初の2文のみを用いる場合と, 段落内全ての連接した2文を用いる場合, 段落内全てから2文を用いる場合の3種類を考慮し順序推定を行った. さらに,Lapata[4]の手法に基づく確率手法と比較した. 比較実験により林らの手法の方が優れた性能であったと報告している.

これらの研究では,文節や文の順序推定を扱った. これらに対して,本論文は``段落''の順序推定を扱うという違いがある.



平成27年3月4日