《表2 词性权重表:利用加权词句向量的文本相似度计算方法》
从表1可知,现代汉语中能标识文本特性的往往是文本中的实词,如名词、动词、形容词等,在句法关系中占据重要地位,而文本中的一些虚词对于标识文本会造成一定的噪音.由此本文根据汉语词性在现代汉语中的分布以及语法规则,设置了相应的等级及词性权重,词性权重表如表2所示,除一级和二级特征词外其余词性的权重均设为0,某篇文档中词语i的词性权重由Ki表示.
图表编号 | XD0096859500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 徐鑫鑫、刘彦隆、宋明 |
绘制单位 | 太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学信息与计算机学院 |
更多格式 | 高清、无水印(增值服务) |