「花」「鳥」「風」「月」

(正解例1)
雪が残る2月ごろからをつけることから名付けられた雪割り桜。

(正解例2)
愛知県豊橋市の養鶏農場の鶏の大量死は、高病原性インフルエンザの感染と27日断定された。

(正解例3)
どこかからに乗って、競馬中継のかん高いアナウンスが聞こえてきた。

(正解例4)
太陽がに隠されてリング状に輝いて見える金環日食が21日、日本の広い範囲で観測可能になる。

(誤り例1)
だが、実際、(花)が盛りになっても、どこかにうつろな気持ちが残るのはなぜだろう。

(誤り例2)
それだけに、宗教的背景からも権威の誇示からも無縁に、「(鳥)の背に乗って大空へ」という作者の個人的な、素朴な夢の表現に見えてうれしかった。

(誤り例3)
旧帝国ホテルの設計者として知られるライト(風)の建築である。

(誤り例4)
米国では、民間企業が(月)や火星の探査に乗り出そうとするなど、宇宙探査の裾野が広がり始めた。

4.27に単語組「花」「鳥」「風」「月」の機械学習の分類結果を示す. 表4.28に単語組「花」「鳥」「風」「月」の正規化α値に基づいた機械学習が参考にした素性を示す.




Table 4.27: 機械学習の分類結果(「花」「鳥」「風」「月」)
  データ数 再現率 適合率
1000 0.72 0.70
1000 0.70 0.71
1000 0.75 0.74
1000 0.82 0.84
総数 4000 0.74 0.74


Table 4.28: 機械学習が参考にした素性(正規化 1#1値:「花」「鳥」「風」「月」)


37#37


「花」の素性として,「梅」や「桜」,「チューリップ」などの植物の名前が挙げられたほか,花には「咲く」や「好き」という動詞が後に続く傾向があるという文法上の素性があった. 「風林火山」の時と同様に,力士の「しこ名」に多く用いられることがあることもわかった.

「鳥」の素性として,「羽」や「鳴き声」,「虫」など鳥の生態に関係する単語が多く出現していた.また「花」と同様に,「ペンギン」や「トキ」のように鳥類の名前も出現していたが,「花」ほど多くは得られなかった. また鳥は人間と関わりが深い動物でもあるため,「繁殖」や「人工」,「野生」,「保護」のような鳥を保護したり,繁殖を高めることを連想させる単語も多い反面,「インフルエンザ」や「感染」のような単語も多いことがわかった.

「風」の素性を得た文章は「風林火山」で用いた「風」という単語とは違う1000文をランダムに選び直した. しかし,「風林火山」の時に現れた素性とは違い,「韓国風」や「山小屋風」のように「何かに似たもの」という意味や,「このような風に」のような「様子」を意味する「風」の言い回しが多く素性として得られた. また,「ゴルフ」や「ヨット」などの風の影響が試合を左右するスポーツも素性として存在した.

「月」の素性として,天体の「月」だけでなく,1ヵ月という意味の「月」,月曜日という意味の「月」が混在していた. また,1ヵ月を表す「月」の周辺単語には「回」や「万」,「円」のように単位や金額が周辺単語に現れる頻度が高いこと,曜日の「月」は(月)のように表記されやすいことがわかった.