Next:
類似度計算例(日本語)
Up:
提案手法(類似度の利用)
Previous:
提案手法(類似度の利用)
Contents
類似度の計算
二つの日本語単語
A
,
C
の類似度の値を
sim(AC)
とすると
sim(AC)
は以下の式
3.1.1
で計算する.
93#93
count(
X
):集合
X
の単語の総数
94#94
,
95#95
:単語
A
,
C
の前後単語の集合
計算はOne-hotのword2vecに類似している. なお類似度の計算においては2単語連続を1単語として用いる. 式
3.1.1
を英語単語
B
と
D
でも同様の計算を行い
sim(BD)
とする.