《表2 HS编码1-2位实验的数据情况与测试结果》
(4) 受数据量影响,对应的文字特征也会随之变化。在现有实验室条件下,当数据量过大时过多的文本特征会使RTM矩阵的构造与训练产生困难,故使用出现频次筛选文本,尽量保留更多的数据:在1-2位的实验中保留出现频次大于1的文本,3-4位的实验中保留频次大于3的数据,5-10位的实验中保留频次大于1的文本。各层次实验具体情况如表2–表4所示。
图表编号 | XD0059635600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.25 |
作者 | 张紫玄、王昊、朱立平、邓三鸿 |
绘制单位 | 南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、中华人民共和国南京海关、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室 |
更多格式 | 高清、无水印(增值服务) |