《表1 外汇投资者情感词典部分示例》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多模态投资者情绪数据的USD/CNY汇率波动率预测研究》
在对自然语言的处理上,使用哈尔滨工业大学社会计算与信息检索研究中心研发的pyltp 3.6进行中文文本分词,在提取关键词时,本研究没有完全采用专家筛选的方法,而是先利用信息检索技术TF-IDF提取关键词,再进行人为筛选。原因是:如果词典当中存在文本数据里没有的关键词,这对于文本向量化与深度学习的训练是没有益处的;另外,由于TF-IDF属于特征工程的一种,在提取关键词的同时可以对其重要性进行排序,所以能够获得具有代表性、明显情感倾向的种子情绪词。再将这些种子情绪词,利用word2vec模型计算、寻找它的相似词,进而构建出含有426个情绪词的外汇投资者情绪词典,部分词如表1所示。中文文本需要转换成一系列向量,作为变量输入LSTM模型,并构建用来索引的语义词典。
图表编号 | XD00198048300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.31 |
作者 | 汪文隽、王亦天、操玮、任思儒 |
绘制单位 | 合肥工业大学经济学院、合肥工业大学经济学院、合肥工业大学经济学院、合肥工业大学经济学院 |
更多格式 | 高清、无水印(增值服务) |