《表1 各个特征项的领域词典中包含的词个数》

《表1 各个特征项的领域词典中包含的词个数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向食品安全事件新闻文本的实体关系抽取研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

通过对食品安全事件统计分析和对中文新闻文本表达特点进行研究,发现与其他类型的新闻相比,不论食品安全事件新闻文本的完整程度如何,通常会包含以下特性:涉事食品、发生原因、涉事企业和发生地点4项,因此将这4项作为关键特征。为了保证它们的正确性,分别构建了关于4项关键特征的领域词典,并将这4个词典称为关键特征词典。关键特征词典中的词汇是从国家药品监督管理局、食品伙伴网等网站的相关模块中爬取的专有名词,共273 709个,各个特征项对应的领域词典中包含词的个数统计结果如表1所示。其中发生原因包括食品添加剂、真菌毒素、污染物、农兽药方面的专有词汇;发生地点包括省级行政区、地级市、县级市和县。