《表1 权重t (wi, cj) 的计算方法》
t(wi,cj)的计算方法有词频(TF)、点互信息(PMI)[17,21]和条件概率(CP)[20]。文献[17]中提出将PMI的方法改为PP-MI,并使用SPPMI方法得到与skip-gram模型等价的结论。文献[20]与Glove模型则使用条件概率计算t(wi,cj)。权重t(wi,cj)具体计算方法如表1所示。其中,#(wi,cj)表示wi与cj共现的次数,#(wi)和#(cj)分别表示wi和cj在语料库中出现的次数,N为语料库中词的总数。当wi和cj未共现时,tPMI(wi,cj)=log 0=-∞。因此本文规定,当#(wi,cj)=0时,tPMI(wi,cj)=0。
图表编号 | XD0035711700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.01 |
作者 | 徐帆、王裴岩、蔡东风 |
绘制单位 | 沈阳航空航天大学人机智能研究中心、沈阳航空航天大学人机智能研究中心、沈阳航空航天大学人机智能研究中心 |
更多格式 | 高清、无水印(增值服务) |