《表4 抽取结果表:面向微博商品评论的情感标签抽取研究》

《表4 抽取结果表:面向微博商品评论的情感标签抽取研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向微博商品评论的情感标签抽取研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本次情感标签抽取实验的统计结果如表4所示,在召回率上,两个数据集显式和隐式标签的抽取都高于85%,表现良好。如对于内容相对密集的评论“不仅外观炫酷,功能强大还非常省电”,本文方法可以准确识别其中两个显式标签,分别为<外观,炫酷>和<功能,强大>,并对隐式表达“省电”进行了填补,得到隐式标签<电池,非常省电>。这与融入依存句法分析对小句进行改进划分有密切的关系,准确的小句划分是精准、无遗漏地抽取评价对象的基础。在准确率上,两个数据集显式标签抽取的准确率同样高于85%,充分证明了本文提取规则的高覆盖率。对于隐式标签,智能手表的抽取准确率为76.3%,手机为76.5%,低于显式特征提取的准确率86.9%和88.9%,有待进一步提高。笔者通过对原始评论的回溯发现其与用户的少数“非特殊性”表达有关,如“棒棒哒”这个情感词可以被用来描述多个特征,而将这类通用情感词具体地划分到某一具体特征上时,容易产生偏差。总体上,与人工识别结果进行比对,本文方法在总体准确率、召回率和F值上均有较好结果,其中总体抽取结果的综合F值为85.3%,抽取结果较为理想。