《表1 农业文本语料数据:一种基于中文关键字符串核函数的分类算法》
测试语料主要来源于中国农业信息网、中国农业网、中国农业资源网和中国农业交易网等,通过爬虫程序下载后进行解析,将标题和正文作为语料库保存.本实验中语料文本共985篇,分为种植业、林业、畜牧业和渔业4类.随机抽取训练集657篇,测试集328篇,训练集和测试集不重复.农业文本语料数据见表1.
图表编号 | XD0035401900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.25 |
作者 | 沈黎、肖勇、刘莺 |
绘制单位 | 湖南农业大学理学院、湖南农业大学理学院、湖南农业大学理学院 |
更多格式 | 高清、无水印(增值服务) |