《表1 违反公平竞争标准文本标题的关键词》

《表1 违反公平竞争标准文本标题的关键词》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大数据背景下公平竞争审查文本的排查研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

需要排查的法律及政策的文本数据来源主要由广东省市场监督管理局官方提供和基于python的Selenium库和Requests库编写的爬虫程序从广东省的各级政府爬取的地方性法规、政策、通告等文本数据,两者相加共2 808份文本数据.将数据收集起来后,通过人工筛选先将数据分为违反了公平竞争标准和没有违反公平竞争标准的两类文本数据,然后分别从两类文本数据的标题中筛选出各自的关键词组成关键词词库,如表1和表2所示列出了关键词词库的关键词,表1是通过人工筛选从违反了公平竞争审查标准的文本的标题中筛选出来的关键词,而表2是通过人工筛选从没有违反公平竞争审查标准的文本的标题中筛选出来的关键词.将关键词词库和需要筛选的数据导入到My SQL数据库中,最后使用数据库My SQL编写的SQL程序对导入的数据进行筛选,筛选出两类文本数据.