《表1 外汇投资者情感词典部分示例》

《表1 外汇投资者情感词典部分示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多模态投资者情绪数据的USD/CNY汇率波动率预测研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在对自然语言的处理上,使用哈尔滨工业大学社会计算与信息检索研究中心研发的pyltp 3.6进行中文文本分词,在提取关键词时,本研究没有完全采用专家筛选的方法,而是先利用信息检索技术TF-IDF提取关键词,再进行人为筛选。原因是:如果词典当中存在文本数据里没有的关键词,这对于文本向量化与深度学习的训练是没有益处的;另外,由于TF-IDF属于特征工程的一种,在提取关键词的同时可以对其重要性进行排序,所以能够获得具有代表性、明显情感倾向的种子情绪词。再将这些种子情绪词,利用word2vec模型计算、寻找它的相似词,进而构建出含有426个情绪词的外汇投资者情绪词典,部分词如表1所示。中文文本需要转换成一系列向量,作为变量输入LSTM模型,并构建用来索引的语义词典。