《表1 语料库样本与人工定义领域词样例》
本文实验数据为国家市场监督管理总局缺陷产品管理中心提供的脱敏消费者产品缺陷线索报告数据与采集的互联网电商商品评论数据。其中,线索报告数据大约有1.5万条(数据集A),互联网数据大约有3万条(数据集B),总计约4.5万条数据。数据包含电子电器、五金建材、儿童玩具等品类,每条数据都由真实消费者提交,部分数据样本如表1所示。由人工筛选确定的领域相关词一般由消费品名称、故障描述短语等构成,大约有1 000条;领域无关词一般由地名、人称、领域无关的动名词构成,大约有4 000条。
图表编号 | XD00198148400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.25 |
作者 | 彭郴、吕学强、孙宁、张乐、姜肇财、宋黎 |
绘制单位 | 北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科技大学网络文化与数字传播北京市重点实验室、中国标准化研究院、北京信息科技大学网络文化与数字传播北京市重点实验室、中国标准化研究院、中国标准化研究院 |
更多格式 | 高清、无水印(增值服务) |