《表1 文本信息检索表:基于文本挖掘的石油市场风险时效性分析》
为了识别石油市场风险及动态演变过程,本文采用Selenium自动化爬虫技术,以Oil risk和Oil market为关键词,检索路透社从2012—2018年的石油市场相关网络文本,共计25666条,文本检索信息如表1所示。然后,利用Python编程对文本进行数据清洗,去除空文本、无关符号、停用词和词形转换等,筛选出15878条有效文本。
图表编号 | XD0082643300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.25 |
作者 | 赵鲁涛、刘丽娜、郭实秋 |
绘制单位 | 北京科技大学数理学院、北京理工大学能源与环境政策研究中心、北京科技大学数理学院、北京科技大学数理学院 |
更多格式 | 高清、无水印(增值服务) |