《表1:基于贝叶斯算法的投资情感分析》
基于K-Means聚类算法实现文本聚类,其原理为先计算关键词词频,再将同类文本聚合。程序按拓扑结构索引,从数据库中调取语段内容,将其切割成关键词,计算主要关键词的词频,去除非关键内容,并画出词云图。将每个个股收集到的各关键词词频列为数据表,实现自然语言的量化(如表1所示),接着通过Matplot功能模块将个股投影到高维欧氏空间,通过K-Means聚类算法将相近数据点聚合,实现去先验化的文本聚类。
图表编号 | XD00150093900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.18 |
作者 | 蒋赟启、黄霞、徐悦 |
绘制单位 | 上海立信会计金融学院、上海立信会计金融学院、上海立信会计金融学院 |
更多格式 | 高清、无水印(增值服务) |