《表5 基于Na觙ve Bayes机器算法的回归结果》

《表5 基于Na觙ve Bayes机器算法的回归结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《分析师预测会利用年报文本信息吗》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:括号内为t值;***、**和*分别表示1%、5%和10%的显著性水平。

本文采用了关键词抓取法来度量文本信息语调,例如“增加”等正面词;“减少”等负面词。然而这些词在具体的语境中可能发生语义反转,例如费用的增加与费用的减少、损失增加与损失减少等等情况。这种关键词抓取法在语句情绪倾向的度量中可能存在误差,可能会影响结果的可靠性。对此,本文采用Li(2010)的Na觙ve Bayes算法,[5]对语句结构进行分析。具体方法是预先设置如“收XXX增”“收XXX提”“费XXX增”和“费XXX提”等基本语句结构元。这样可以忽略语句中其他成分的干扰,仅提取基本成分的名词与形容词,可以更准确地分析语句情绪倾向。本文预先设置的语句数达到264个,能够基本准确地模拟人工阅读的判断标准,所得结果基本可靠。根据Na觙ve Bayes算法得到的文本信息,对模型(3)进行回归,结果见表5(表5在原变量名前分别加Bayes表示Na觙ve Bayes算法下的变量代码)。由表5的回归结果可知,在采用机器学习方法度量文本信息语调后,本文结论并未发生改变。