《表1 三类新闻的定义:异质性财经新闻与股市关系研究》
本文采用Word2Vec+k-Means方法对新闻文本进行聚类以划分类别,通过Word2Vec中的CBOW算法,将向量维度设定为300训练模型,之后调用模型将每一条新闻文本转换为向量,并采用k-Means方法对所有新闻文本进行聚类分析,为确定最佳聚类个数,利用肘部图和轮廓系数法进行综合判断,最终将新闻划分为三类,并依据其内容分别定义为股市波动类、股权及高管变动类、公司战略及其他类财经新闻,如表1所示。
图表编号 | XD00212865500 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.25 |
作者 | 吕华揆、刘政昊、钱宇星、洪旭东 |
绘制单位 | 武汉大学信息资源研究中心、武汉大学大数据研究院、武汉大学信息资源研究中心、武汉大学大数据研究院、武汉大学信息资源研究中心、上海财经大学财经研究所 |
更多格式 | 高清、无水印(增值服务) |