《表1 网易公开课课程笔记UGC数据样例》

《表1 网易公开课课程笔记UGC数据样例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于UGC知识融合的MOOC课程笔记自动生成》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本实验于2018年3月1日使用Python进行数据采集,为了避免由于数据量过小导致的过拟合问题,选择具有一定规模数量UGC的热门视频———《演讲与口才》和《机器学习的动机与应用》分别为本实验的训练集和测试集。训练集和测试集分别包含UGC原始数据1563条和1157条,采集的数据字段除了笔记信息,还包括时间戳、用户名及点赞数,数据样例见表1。