next up previous contents
次へ: 実験結果 上へ: 実験データ 戻る: 単文コーパスを用いた実験   目次

重文複文コーパスを用いた実験

辞書の例文より抽出した重文複文コーパス122,719文[16]から,表5.4に示す文数を実験に用いる.



表: 重文複文コーパス
英語・日本語学習文 各100,000文
英語・日本語テスト文 各10,000文
英語・日本語ディベロップメント文 各1,000文


統計翻訳の前処理として,各コーパスの日本語文に対して,``chasen[17]''を用いて形態素解析を行う. また,英語文に対して,``tokenizer.perl[14]''を用いて,わかち書きを行う. 重文複文の実験データの例を表5.5に示す.


表: 重文複文実験データの例
例1
日本語文 その 家 を 借りる 事 に 決め て き た 。
英語文 We have decided to rent that house .
例2
日本語文 この 町 は 鉄道 が ない ので 不自由 だ 。
英語文 This town is inconvenient because of its lack of railways .
例2
日本語文 彼 は 離婚 し て 一 人 に なっ た 。
英語文 He became single after he got divorced .



平成25年2月13日