《表3 两种分词对比表:融合信息熵与多权TF-IDF的营销评论关键词提取算法》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合信息熵与多权TF-IDF的营销评论关键词提取算法》
互联网营销活动的标题和评论包含新词,传统分词算法可能无法实现新词的提取。本实验利用互信息和左右熵,以Tire树为数据结构提取新词。互信息是一个词语中包含的关于另一个词语的信息量,即两个词共同出现的概率。左右熵衡量预选词的自由度。左右熵越大,说明该预选词越有可能是独立词语。通过传统分词算法和基于互信息和左右熵的分词算法的分词结果见表3。
图表编号 | XD00192258600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.01 |
作者 | 李璐、何利力 |
绘制单位 | 浙江理工大学信息学院、浙江理工大学信息学院 |
更多格式 | 高清、无水印(增值服务) |