《表4 抽取结果表:面向微博商品评论的情感标签抽取研究》
本次情感标签抽取实验的统计结果如表4所示,在召回率上,两个数据集显式和隐式标签的抽取都高于85%,表现良好。如对于内容相对密集的评论“不仅外观炫酷,功能强大还非常省电”,本文方法可以准确识别其中两个显式标签,分别为<外观,炫酷>和<功能,强大>,并对隐式表达“省电”进行了填补,得到隐式标签<电池,非常省电>。这与融入依存句法分析对小句进行改进划分有密切的关系,准确的小句划分是精准、无遗漏地抽取评价对象的基础。在准确率上,两个数据集显式标签抽取的准确率同样高于85%,充分证明了本文提取规则的高覆盖率。对于隐式标签,智能手表的抽取准确率为76.3%,手机为76.5%,低于显式特征提取的准确率86.9%和88.9%,有待进一步提高。笔者通过对原始评论的回溯发现其与用户的少数“非特殊性”表达有关,如“棒棒哒”这个情感词可以被用来描述多个特征,而将这类通用情感词具体地划分到某一具体特征上时,容易产生偏差。总体上,与人工识别结果进行比对,本文方法在总体准确率、召回率和F值上均有较好结果,其中总体抽取结果的综合F值为85.3%,抽取结果较为理想。
图表编号 | XD00107793000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 李博诚、张云秋、杨铠西 |
绘制单位 | 吉林大学公共卫生学院、吉林大学公共卫生学院、大连理工大学国际信息与软件学院 |
更多格式 | 高清、无水印(增值服务) |