《表6 文本粒度训练的时间效率表》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大数据环境下政务数据的情报价值及其利用研究——以海关报关商品归类风险规避为例》
总体上看,词粒度的文本与字粒度的文本表现差距很小,在2位与4位的HS编码上词粒度的优势更大,但差距有限;在10位编码的分类问题上,基于字粒度特征的分类优势更为显著,因此叠加后的整体实验里,字特征的总体效果更好,也就是说当每个类数据量有限,或者类之间的相似程度高时,字粒度文本特征的效果优于词粒度文本特征,二者训练时间效率,见表6。
图表编号 | XD00193253100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 王昊、邓三鸿、朱立平、王鑫芸、范涛 |
绘制单位 | 南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京海关、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室 |
更多格式 | 高清、无水印(增值服务) |