《表1 数据集的结构:基于社交平台数据的文本分类算法研究》
可见数据集的统计值比正常的文本分类数据集统计值小,表中展示了“天气”类数据集的文本行数均值为3.3行,对应的每篇文本字符平均数量为67.8,单词平均数量为15;而“食物”类数据集的文本行数2.7,对应的每篇文本字符平均数量为57.7,单词平均数量为13.15。可见2个种类的数据集和整体数据集的统计信息相差不大。
图表编号 | XD0017068200 严禁用于非法目的 |
---|---|
绘制时间 | 2018.10.15 |
作者 | 施瑞朗 |
绘制单位 | 杭州电子科技大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |