次へ: 手順3:の算出と名詞句の分解
上へ: 各手順の説明
戻る: 手順1:判断条件と格要素の取得
目次
手順2:名詞句の認識
手順1で取得した「被修飾語句」から,名詞句を認識する方法を説明する.本研究で扱う名詞句は「の」型,「」型,「」型の3パターンのみなので,「被修飾語句」と,「被修飾語句の2単語前までの単語」の3単語分の形態素解析結果を参照し,その単語の品詞情報を得る.ここでは「被修飾語句」が「弁当」なので,その2単語前までの「コンビニ」と「の」の形態素解析結果を参照する.例として,手順1の文に対して形態素解析した結果を図4.3に示す.
図:
形態素解析の出力例
|
キチツヨチヌイ鮴呂僚侘呂法屮灰鵐咼1100,…」とあり,この「1100」の4桁の値から品詞を得る.本研究で扱う品詞の識別法方を以下に示す.「.」の桁にはどの数字が入力されてもよいことを表す.
- (1)
- 「310.」→形容詞
- (2)
- 「321.」→形容動詞
- (3)
- 「7410」→「の」(「が」,「から」,「で」,「へ」等も含む)
- (4)
- 「1800」→「の」(「ため」,「こと」等も含む)
- (5)
- 「1[8以外].0」→名詞
- (6)
- 「6..0」→名詞(「〜さん」や「単位」等の補助的な単語)
例として「コンビニの弁当」でいえば,「コンビニ(1100)」が(5)に当てはまり「名詞」,「の(7410)」が(3)に当てはまり「の」,「弁当(1100)」が(5)に当てはまり「名詞」となり,「の」型の名詞句パターンに当てはまる.名詞句パターンにマッチしていた場合,それを名詞句として扱う.この際,修飾語句の部分と被修飾語句の部分に分けた状態で保存すると後の手順で扱いやすい.
Sho Takemoto
平成24年3月13日