《表1 网易公开课课程笔记UGC数据样例》
本实验于2018年3月1日使用Python进行数据采集,为了避免由于数据量过小导致的过拟合问题,选择具有一定规模数量UGC的热门视频———《演讲与口才》和《机器学习的动机与应用》分别为本实验的训练集和测试集。训练集和测试集分别包含UGC原始数据1563条和1157条,采集的数据字段除了笔记信息,还包括时间戳、用户名及点赞数,数据样例见表1。
图表编号 | XD0039038200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.28 |
作者 | 胡潜、李静 |
绘制单位 | 华中师范大学信息管理学院、华中师范大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |