《表1 分词结果:双向GRU和自注意力机制下微博情感倾向性分析》
结巴分词[8]是国内程序员用Python开发的一种中文分词模块,该模块可以准确的识别出分词,将连续的字序列按照一定的规范重新组合成词序列。该模块支持4种分词模式:精确模式、全模式、搜索引擎模式、自定义字典模式。在分词时,针对含有大量网络新词的微博文本,如果仅仅依靠精确模式的结巴分词法,并不能正确分词。故使用自定义字典模式将近年来微博表情词、搜狗网络新词、网络流行词、QQ输入法网络流行语、搜狐网络新词加入结巴分词词库。分词结果见表1。
图表编号 | XD00149975500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 杨凡、薛佳奇 |
绘制单位 | 西安建筑科技大学理学院、北京搜狗科技发展有限公司 |
更多格式 | 高清、无水印(增值服务) |