《表1 风险类型提取部分结果》

《表1 风险类型提取部分结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于三重维度的企业风险信息抽取方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对风险描述文本进行预处理后,编写适当的正则表达式对风险信息数据进行风险类型提取。经过去重处理,最终获得1390种不同表述的风险类型,随机选取20个文本所对应的风险类型抽取结果,如表1所示。对风险类型提取结果进行简单分析可以发现,尽管针对同一风险,不同公司因其所处行业、经营范围以及年报撰写者语言表述习惯等的不同,年报中提及的风险类型的描述详细程度大不相同。以“管理风险”为例,就有着“集团化管理风险”、“经销商管理风险”、“经营管理风险”、“内部管理风险”、“企业管理风险”、“存货管理风险”、“并购管理风险”等多达60余种不同表述。为了保证信息抽取结果能最大限度地还原年报中的风险信息,本文不对上述风险类型做合并处理。每个风险信息文本对应一种风险类型,该风险类型构成一维风险信息。