《表1 文本信息检索表:基于文本挖掘的石油市场风险时效性分析》

《表1 文本信息检索表:基于文本挖掘的石油市场风险时效性分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于文本挖掘的石油市场风险时效性分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了识别石油市场风险及动态演变过程,本文采用Selenium自动化爬虫技术,以Oil risk和Oil market为关键词,检索路透社从2012—2018年的石油市场相关网络文本,共计25666条,文本检索信息如表1所示。然后,利用Python编程对文本进行数据清洗,去除空文本、无关符号、停用词和词形转换等,筛选出15878条有效文本。