BERTでは, どのような語があれば記事中に単語対が出現するかを学習する. 例えば, 単語対A, Bがあるとする. A, Bを含む文を収集する. 収集した文中からA, Bを削除し, Xとする. Xとした部分にA, Bどちらの語があったのかを学習結果を元に推定する.
BERTの素性分析の方法について述べる. BERTを用いてテストデータを1単語ずつに分ける. 分けた1単語に対してBERTを用いることで, 分けた1単語の分割, 非分割に関するそれぞれ値が算出される. 算出された値が分割の値が大きい場合, 分割に関する素性, 非分割の値が大きい場合, 非分割に関する素性であると判断する.算出された値が分割の値が大きい場合, 分割に関する素性, 非分割の値が大きい場合, 非分割に関する素性であると判断する.