next up previous contents
Next: 情報の集約 Up: システム Previous: レスの分割および宛先の決定   目次

レスからの抽出

レスからの情報の抽出を行うために,「商品名」,「評判情報」については,人手により, あらかじめレスから情報の抽出を行い,正解データとしてリスト化をした.

リスト化する際,「商品名」と判断した定義をは次の通りである.

実際に作成した商品名辞書を図4.4に示す. 総商品名数は86件である.


図 4.4: 商品名辞書
たこ焼き
豚まん
ウィスキーのケーキ
キンツバ
こしぬけうどん
丸福珈琲のゼリー
堂島プリン
今井のおうどん
ツマガリのクッキー
生菓子
丸福珈琲
珈琲
ケーキ
堂島プリン
たこまさのたこやき
てんてんの餃子
モノレールうどん
五色どらやき
点天の餃子
水ナス漬け
田辺大根
お好み焼き
いかやき
茜丸
焼き菓子
ロールケーキ
たこべぇ
パイン飴
御堂筋弁当

肉まん
餃子
じゃがりこ
きんつば
小エビの天ぷら
あんプリン
粟おこし
みたらし団子
チーズケーキ
御座候
通天閣コーヒー
高級佃煮
明石焼き
トンカツ定食
焼き餅
タコ焼き羊かん
たこ焼き饅頭
酒饅頭
喜矢州
パチパチパンチ
大阪の臭い水道水
ミネラルウォーター
たこ焼
洋菓子
ロールケーキ
乾き物
ヒロタのシュークリーム
明石焼き
お米のルーロ
ムジカの紅茶
赤福
神宗の昆布
泉州の水茄子漬け
泉州タマネギ
大阪みやげ
大阪バナナ
タコ焼き
鉄板付きのたこ焼
リクロおじさん
まつのはこんぶ
京都の抹茶プリン
バターサンド
北海道六花亭マルセイバターサンド
タマネギ
茜丸のどら焼き
林檎
檸檬
若ごぼう
ハチエモン
観音屋のチーズケーキ
デンマークの生のチーズ
カステラ生地
自由軒の卵カレー
インデアンカレー
大阪寿司
サザエボン
たこ焼きプリッツ

評価情報についても同様に人手によりリスト化を行う. 評価情報として判断した定義は次の通りである.

4.5に実際に作成された評価表現辞書を示す. 評価表現数の総数は78件であった.



図 4.5: 評価表現辞書
家族への土産には良い
こじゃれたお土産
お勧めのお土産
南部の人には不便
出張帰りに買えるわけで
はありません
お勧め
お店もいくつかあって
買いやすいのも良い
重くて
クール便で送る
のがいい
お土産向き
ネーミングだけではなく
、味も評価高い
良さそう
女性が多いところへの
お土産だとかなり喜ばれそう
上品
まずい
あんまりいない
ギネス
長い
ウケ狙い
おススメ
チョコ味
日持ちする
美味しい
冷凍食品として売ってる
普通
便利

ウマー
好き
臭ス
ちょっとだけ辛い
小さい
困ったら
不評
手軽
安い
味もソコソコ
ツッコミ期待
日持ちの面で微妙
うけた
良し悪しはわからない
お歳暮
美味い
バターで焼いてて
中にこんにゃく
冷めてもウマー
会津◯なんて食えねぇ
マイナー
大好評
死ぬほど不味かった
美味しかった
有名
悪名高い
匂いはまし
コピペ
見た目も綺麗
味おちてない?
おいしかったのは昔の話
味が劣化
悲しい
ウマー
めいぶ〜つ♪
一番の御馳走
安くて美味しい
大層気に入られた
ウマー
味が似てます
名物
砂糖で甘すぎで美味しくはない
香料臭くてたまらん
おすすめは絶対しない
食べられない
冷蔵状態でないと持ち歩くのは難しい
微妙
結構好きな味
ロクなものがねえや
個包装
配りやすい
インパクトがあって
食える

作成したリストを用いて,一致した情報を抽出するプログラムを作成した. これにより,各レスにおける「商品名」と「評価情報」の抽出ができた.

「場所名」の抽出は2.2.2節にて述べた``MeCab''を用いて,「地域」となる要素 を場所名として抽出するプログラムを作成した.

各レスの「商品名」,「場所名」,「評価情報」,および「$ \phi$ 」,から全て の組み合わせで3つ組を作成する. 図4.6に出力3つ組例に使用したレスの一部を,図4.7に実際に作成された3つ組の例を示す.


図 4.6: 出力3つ組例に使用したレス(一部)
\begin{figure}\begin{center}
{\small
\begin{tabular}{l}
\hline
24 :名無し...
...なんだったんだろ。\\
\hline
\end{tabular}}\end{center}\end{figure}

図 4.7: 出力3つ組例
\begin{figure}\begin{center}
{\small
\begin{tabular}{l}
\hline
24 (ケーキ,梅...
...\phi$);($\phi$,沖縄,$\phi$)\\
\hline
\end{tabular}}\end{center}\end{figure}


next up previous contents
Next: 情報の集約 Up: システム Previous: レスの分割および宛先の決定   目次
2013-02-23