《表1 用于实验的数据信息》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Word2Vec对海关报关商品文本特征降维效果分析》
本文数据来源于国内某海关2016年3月-2016年6月的报关数据,所涉及数据主要包括海关商品名称(Goods)、商品描述(Description)和海关HS编码(HS_id)三个字段,共计515 186条商品记录,各字段数据具体信息如表1所示。其中,HS_id字段为10位编码,Goods和Description两个字段为文本,例如:在商品名称字段中,“人造棉印花布”是“人造棉”、“印花”和“布”三个词语的简单组合,其对应的商品描述内容为“机织|印花|平纹|100%人造棉|150CM|188G/M2|无品牌”。对商品不同层面的描述均使用“|”进行分隔,两个字段的文本内容均为词语的简单组合,且词语间无明显上下文逻辑关系。
图表编号 | XD00139947000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.25 |
作者 | 朱立平 |
绘制单位 | 南京大学信息管理学院 、江苏省数据工程与知识服务重点实验室 |
更多格式 | 高清、无水印(增值服务) |