《表1 双语法制新闻新增关键词表》
网络大数据能直观呈现公众关注的热点,是了解公众需求的重要渠道。近年来,许多网站都发布了与民族地区双语法制人才相关的新闻,这类信息被关注人数多,点击量大,观点明确。本研究采用网络爬虫工具,以关键词(我国少数民族语言文字政策文本中出现的与双语法制相关16个关键词(1))为主,从百度、新浪、中国法制信息网及各级人民法院网等门户网站,获取到与主题相关度极高新闻816条(2)。对这些新闻文本进行分词,去除停用词,以出现频次在30次以上为选取阈值,剔除技术特征表征较弱的词语,得到与主题相关的词汇序列。根据新闻数量增长的分布特征,并结合人工介入筛选,共得到三个阶段的新增关键词列表,如表1所示。
图表编号 | XD005185900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.20 |
作者 | 陈丽湘 |
绘制单位 | 教育部语言文字应用研究所、北京语言大学中国语言政策与标准研究所 |
更多格式 | 高清、无水印(增值服务) |