next up previous contents
次へ: 作成の様子 上へ: 辞書の作成 戻る: 手順   目次


情緒成分と情緒傾向値$ \theta $

情緒タグの集計から得られた, パターンにおける情緒の共起確率を,「情緒成分」と呼ぶことにする. 本辞書では5分類系の情緒名を使用する.情緒をPositiveとNegativeの2分類 とすることや,「情緒なし」を含めて3分類とすることもあるが,本辞書では Negativeな情緒のうちにも,攻撃的な反応と結び付きやすい《怒り》や《嫌だ》 を,《悲しみ》や《恐れ》と区別するために,5分類系としている.5分類系の情 緒のラベルと対応する情緒は以下の通りである.

1つの文末表現であっても,複数の情緒が伴うことが多い.たとえば,「宿題し ようかな…。」という文では,もの悲しい感じがするし,期待感もある.しかし, 傾向としては、悲しい感じが強いと言えるだろう.こうした情緒的な傾向を表す 値を「情緒傾向値$ \theta $ 」と本辞書では呼ぶ.情緒傾向値 $ \theta $ と5分類系のラベルは次の関係にある.

《P》,《N》,《A》の3つは,図6の関係にあり, $ \theta $ = 60のとき,《P》の傾向が最も強いと判断し, $ \theta $ = 180のとき,《N》の傾向が最も強いと判断する. なお,便宜上,《P》,《N》,《A》が同一である場合には, $ \theta $ は負の値を与えている.

図 6: 情緒傾向値$ \theta $ と情緒名の関係
\includegraphics{theta_image.eps}

情緒成分から$ \theta $ への変換

$ \theta $ は,《P》,《N》,《A》の値を一次元化した値であるが, この値は光のRGBをHSVに変換する式を用いて算出できる. RGB(Red,Green,Blue)をHSV(H:色相,S:彩度,V:明度) に変換した際の色相に対応するのが$ \theta $ である. まず,《P》,《N》,《A》の中の最大値を$ MAX$ ,最小値を$ MIN$ として, 以下の式で$ tmp$ を算出する.

(《P》を$ P$ ,《N》を$ N$ ,《A》を$ A$ とする.)

$\displaystyle tmp = \left\{
\begin{array}{@{\,}ll}
60 \times \frac{N - A}{MAX -...
...s \frac{P - A}{MAX - MIN} + 240 & \textrm{if} \quad MAX = A
\end{array}\right. $

さらに, $ tmp \> += 360 \quad \textrm{if} \quad tmp < 0$

算出された$ tmp$ の値を+60ずらしたものが$ \theta $ の値である.

変換例

パターンの情緒成分が《P》:75%,《N》:0%,《A》:25%,《S》:0%,《なし》:0%の場合の$ \theta $ を算出する.

最大値は《P》なので,$ MAX=0.75$ , 最小値は《N》なので,$ MIN=0$ となる. $ tmp$ を算出すると,

$\displaystyle tmp = 60 \times \frac{0 - 0.25}{0.75 - 0} + 0 = -20 \>\>,\>\> tmp = -20 + 360 = 340
$

この$ tmp$ を+60ずらした値,すなわち40が$ \theta $ となる.



平成21年3月10日