next up previous
次へ: 翻訳システム 上へ: 実験 戻る: 実験

コーパス

本研究では,辞書から抽出した実験には単文コーパスと重文複文コーパスの2 種類を利用する[4].日本文は,chasenを使っ て形態素解析を行う.表2に,利用したコーパスの文数を示す.ま た表3に使用した例文を示す.


表 2: 使用したコーパスの文数
学習データ 100,000文
ディベロップメントデータ 1,000文
入力文(テスト文) 10,000文


表 3: 使用したコーパスの例文
単文
入力文1 銀行 は ちょうど 駅 の 向かい に ある 。
正解文1 The bank is just across from the station .
入力文2 火 は 台所 から 出 た 。
正解文2 The fire started in the kitchen .
入力文3 学校 は 4月 から 始まり ます 。
正解文3 School starts in April .
重文複文
入力文1 彼 は 言う ばかり で 行動 が 伴わ ない 。
正解文1 He is all talk and no action .
入力文2 あれ が 彼 の 住ん で い た 家 で ある 。
正解文2 That is the house in which he lived .
入力文3 彼 は 泳げる と 言っ た 。
正解文3 He said he could swim .


next up previous
次へ: 翻訳システム 上へ: 実験 戻る: 実験
Jin'ichi Murakami 平成25年6月26日