《表1 部分有效词汇及词频统计》

《表1 部分有效词汇及词频统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于PMC政策评价模型的杭州网约车政策分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

文本挖掘技术是从文本数据中抽取有价值的信息、知识的计算机处理技术。政策评价需要通过足够的待测样本数据才能使评价更加客观全面,而通常情况下用人工方式查找和处理信息非常困难,因此本文利用ROSTCM6软件进行分词提取及词频统计。通过访问我国政府部门的官方网站和相关政策年鉴,选取我国于2019年1月1日前颁布的247项网约车政策。将所收集的政策文本导入ROSTCM6软件的文本挖掘数据库,形成文档集进行文本分词处理。笔者随后对进行过分词的文档集进行词频统计,将输出的分词结果按照词频由高到低依次显示。由于样本选取对象为网络预约出租汽车政策,因此“网络预约”“出租汽车”等词汇的出现频率较高,在分析政策特性时这类词属于对结果无明显作用的多余词汇,其他较常出现的“重大”“特别”等程度副词及“提高”“减少”等动词也无明显作用,均被剔除。整理后得出本文将要着重分析的有效高频词汇如表1所列。