《表1 上证指数股票评论数据描述性统计》
获取的评论中包含大量重复评论、与股票大盘主题无关的评论,首先对原始评论数据进行清洗,以保证文本分类的有效性。本文利用Python语言去除了原始数据中html符号、无效页面、重复信息、空白符号、仅有数字或字母等与股市无关的信息,并剔除了休市时期的数据。最终得到197 515条有效评论,股吧评论数据的描述性统计如表1所示(保留2位小数)。
图表编号 | XD00204921100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.01 |
作者 | 庞智亮、张宁、何立峰、景艳锋 |
绘制单位 | 青岛大学商学院、青岛大学商学院、青岛大学商学院、青岛大学商学院 |
更多格式 | 高清、无水印(增值服务) |