《表3 各类型政策工具高频关键词及其权重(部分)》

《表3 各类型政策工具高频关键词及其权重(部分)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《我国政府开放数据政策的实施现状和特点研究:基于政府公报文本的量化分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

研究使用TF-IDF算法对关键词赋予不同权重,能够有效过滤常见词汇,保留重要词汇,进而提高抽取准确率。依照公报文本语料库和编码分词,在Python中提取文本关键词;整合相似的文本数据,删除无实际作用的字段,根据TF-IDF算法计算关键词权重。政府开放数据公报文本中各类型政策工具的高频关键词及其权重计算结果(部分)如表3所示。其中,政策工具的二级维度包括数据平台建设、大数据技术、信息系统、数据资源、开放数据目录清单、数据整合集成、数据治理、数据交换、经济发展、产业发展等方面。