《表1 1 基于不同中文分词方法计算的业务相似公司消息》

《表1 1 基于不同中文分词方法计算的业务相似公司消息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《经营信息披露与股票收益联动——基于财务报告文本附注的分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:括号内列示t值(Fama Macbeth回归系数t值使用Newey-West两期异方差自相关一致标准误计算);***、**、*分别表示在1%、5%、10%水平上双侧检验显著

本文主检验业务相似度变量使用经精确模式分词的目标语句词语单元匹配产生的公司层面经营信息向量计算。精确模式分词的优点在于对一个短语结构只产生一种最符合逻辑的短语切割方法,即目标语句的任意部分只唯一对应一个词语单元,最大限度保持切割后词语单元含义的准确性。而精确模式分词的缺点在于无法囊括目标语句所有可能的词语组合,有可能遗漏部分具有信息含量的词语,即只能做到准确分词而无法做到全面分词。鉴于此,本文进一步使用Jieba分词工具库中全模式分词法和搜索引擎模式分词法两种全面分词方法重新计算业务相似度变量VOLSi m Newsi,t-1、M VS i m N e w si,t-1和ESim Newsi,t-1,以考察文章主检验结果的稳健性。回归结果如表11所示。