《表2 短语挖掘实验结果:基于CNN的消费品缺陷领域词典构建方法研究》
本实验是基于分词后的语料库,采用相邻词语频率短语挖掘方法从文本中挖掘出领域短语词。部分结果如表2所示,其中含有空格的词为短语词,如“充电口”,表示分词结果为“充电”和“口”,其短语为“充电口”。E为公式(3)中结果。可以看出,短语出现频率较高的有“质量问题”“产品缺陷”等与消费品故障相关短语,但也包含“可能会”“使用过程中”等无关短语。值得一提的是,本文方法对于“质量检测总局”“消费者权益保护法”这类比较长的短语词挖掘结果表现良好;同时,“共享单车”这类网络新词挖掘结果也较为满意。
图表编号 | XD00198148000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.25 |
作者 | 彭郴、吕学强、孙宁、张乐、姜肇财、宋黎 |
绘制单位 | 北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科技大学网络文化与数字传播北京市重点实验室、中国标准化研究院、北京信息科技大学网络文化与数字传播北京市重点实验室、中国标准化研究院、中国标准化研究院 |
更多格式 | 高清、无水印(增值服务) |