統計翻訳の前処理として,各コーパスの日本語文に対して,``chasen[17]''を用いて形態素解析を行う.
また,英語文に対して,``tokenizer.perl[14]''を用いて,わかち書きを行う.
重文複文の実験データの例を表5.5に示す.
例1 | |
日本語文 | その 家 を 借りる 事 に 決め て き た 。 |
英語文 | We have decided to rent that house . |
例2 | |
日本語文 | この 町 は 鉄道 が ない ので 不自由 だ 。 |
英語文 | This town is inconvenient because of its lack of railways . |
例2 | |
日本語文 | 彼 は 離婚 し て 一 人 に なっ た 。 |
英語文 | He became single after he got divorced . |