《表4 语义特征集:基于支持向量机的新闻事件类型识别》

《表4 语义特征集:基于支持向量机的新闻事件类型识别》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于支持向量机的新闻事件类型识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文使用《同义词词林(扩大版)》中的语义编码作为候选词语的语义特征,见表4。《同义词词林(扩展版)》中包含了五级语义编码,其中第一、二、三级语义分类数分别为12、97和1 400个,第四、五级语义分类数量更有指数级的增长。在机器学习中,特征样本的增多容易造成数据稀疏问题,降低分类的召回率。因此选用第二级语义编码作为词语的语义特征,进行新闻事件的类型识别。