次へ: 単語の変数化
上へ: 名詞句パターン化の方法
戻る: パターン化の手順
目次
単語アライメントとは,日本語表現,英語表現において,単語対応をとることで
ある.
まず,日本語表現,英語表現それぞれで形態素解析を行う.次に,形態素解析結
果から,辞書``bickey''を用いて対応をとる.
以下に例を示す.
- (日本語表現)
- 彼女の指
- (英語表現)
- her fingers
この例において,まず日本語で形態素解析を行う.
− 1. /彼女(1710,NI:24,NI:49,KR:0601s07,KR:9901s88)
− 2. +の(7410)
− 3. /指(1100,NI:598,NI:607,NI:608,KR:5201k00)
この1,3の単語において英語表現と対応をとる.
英語表現においてもtokepieを使い形態素解析を行う.以下に示す.
1/. her(1421)
2/. fingers(1122 finger)(2102 finger)
()内は意味属性であり,``1421''は,``代名詞''を,``1122''は``名詞''を,
``2102''は``動詞''を示している.
ここで,brillを使い品詞を一意に絞ると以下のようになる.
1. her(1421)
2. fingers(1122 finger)
そして,対応辞書bickeyを用いて,``彼女'',``指''の対訳を検索する.
表 2:
対訳辞書(bickey):part1
日本語 |
対訳英語 |
彼女 |
her,she |
指 |
digit,finger |
上記の辞書より,
``彼女
her''の対応が,``指
finger''
の対応が上手くとれる.
しかし,アライメントが上手くとれない問題もある.その問題について以下に示す.
- 1. 対応辞書の問題
-
対応辞書に無い単語は,アライメントがとれない.例えば,デ−タ
に,日本語
表現``悪事'',英語表現で``crime''があり,変数化を行いたいが,
対訳辞書では,``悪事''に対して表3に示す英語しかないため,対応がと
れない.
表 3:
対訳辞書(bickey):part2
日本語 |
対訳英語 |
悪事 |
evil, ill, misdoing,perpetration,roguery,vice,
villainy,wrong |
- 2. 複合名詞の問題
-
複合名詞の場合,きちんとした対応がとれない問題がある.例を以
下に示す.
- (日本語表現)
- 彼の血圧
- (英語表現)
- his blood pressure
このアライメントをとると,
「彼
his」,「血圧
pressure」の対応となった.つまり,本来``血圧=blood
pressure''の対応であるべき箇所がうまく対応できていない.これ
は,辞書「bickey」に血圧の対訳として``blood pressure''が存在
しなかっ
たためである.さらに,存在したとしても,先に当たった方が優先
されるため,うまく対応が取れない可能性が高い.
- 3. 日本語表現と英語表現の問題
-
日本語表現と英語表現には双方さまざまな表現の仕方がある.
例えば,日本語表現``前科のある男''の場合,他の日本語表現として,``前科
者'',英語表現では,`` a man with convictions'',
``ex-convict''などがある.
今回,日本語表現``前科のある男''の対応として英語表現``ex-convict''があっ
た.まず,この日本語表現を形態素解析すると以下のようになる.
− 1. /前科
− 2. +の
− 3. /ある
− 4. /男
1(前科),3(ある),4(男)の単語において,英語表現と対応をとるが,
英語表現の方を見るとの1単語
``ex-convict'',意味``前科者''を用いており,1,3,4共に対応がとれなかっ
た.
平成18年3月24日