《表4 语义特征集:基于支持向量机的新闻事件类型识别》
本文使用《同义词词林(扩大版)》中的语义编码作为候选词语的语义特征,见表4。《同义词词林(扩展版)》中包含了五级语义编码,其中第一、二、三级语义分类数分别为12、97和1 400个,第四、五级语义分类数量更有指数级的增长。在机器学习中,特征样本的增多容易造成数据稀疏问题,降低分类的召回率。因此选用第二级语义编码作为词语的语义特征,进行新闻事件的类型识别。
图表编号 | XD0050160900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.25 |
作者 | 李响、杨小琳、魏勇、董玮、胡涛 |
绘制单位 | 信息工程大学地理空间信息学院、31008部队、31008部队、31008部队、31008部队 |
更多格式 | 高清、无水印(增值服务) |