《表1 根据随机森林法选出的21个关键词及其重要性》
本文基于网民的发帖行为,使用网络爬虫数据挖掘技术,在东方财富网“股吧”抓取了2017年7月1日至2017年12月31日共125个开盘日的4269条语句,并用ROST ContentMining内容挖掘系统对语句进行分词处理和词频统计,初步选取出了90个关键词。依据此90个关键词的对应开盘日的百度指数,共11250个数据,通过随机森林法筛选出重要关键词21个,结果如表1所示。最后结合主成分分析法构造社交网络指数。由此,基于随机森林主成分分析法的社交网络指数表达式为:
图表编号 | XD00124201400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.25 |
作者 | 许珂、刘峰、李柳洋 |
绘制单位 | 东南大学经济管理学院、东南大学土木工程学院、东南大学土木工程学院 |
更多格式 | 高清、无水印(增值服务) |