《表1 权重t (wi, cj) 的计算方法》

《表1 权重t (wi, cj) 的计算方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于中心化相似度矩阵的词向量方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

t(wi,cj)的计算方法有词频(TF)、点互信息(PMI)[17,21]和条件概率(CP)[20]。文献[17]中提出将PMI的方法改为PP-MI,并使用SPPMI方法得到与skip-gram模型等价的结论。文献[20]与Glove模型则使用条件概率计算t(wi,cj)。权重t(wi,cj)具体计算方法如表1所示。其中,#(wi,cj)表示wi与cj共现的次数,#(wi)和#(cj)分别表示wi和cj在语料库中出现的次数,N为语料库中词的总数。当wi和cj未共现时,tPMI(wi,cj)=log 0=-∞。因此本文规定,当#(wi,cj)=0时,tPMI(wi,cj)=0。