《表5 原始文本数据(部分)》
由于中国大学MOOCs(慕课)国家精品在线学习平台上有充足的各类优质课程,每门课均记录了较全面的学生评论信息,且数据充足、可靠,因此本实验所使用的数据集主要从该网站的课程评论区采集。数据集构建思路:首先爬取了2017年和2018年已经结课的所有课程评论;然后对数据集进行清理,去除重复发表的样本和不含文本信息的样本以及无效的数据样本,将处理过的课程评论数据形成一个总的数据集Data;最后整理课程评论数大于2 000的6门课程的课程评论,并将其分别单独存放。部分原始课程评论数据展示如表5所示。
图表编号 | XD00166000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 胡荣、崔荣一、赵亚慧 |
绘制单位 | 延边大学智能信息处理研究室、延边大学智能信息处理研究室、延边大学智能信息处理研究室 |
更多格式 | 高清、无水印(增值服务) |