《表1 数据分词结果:基于招聘文本信息的信息与计算科学专业知识结构需求研究》

《表1 数据分词结果:基于招聘文本信息的信息与计算科学专业知识结构需求研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于招聘文本信息的信息与计算科学专业知识结构需求研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

(1)jieba分词。对清洗好的数据转换为txt文本,用python开发的jieba库,它是优秀的中文分词第三方库。它有精确模式、全模式和搜索引擎模式三种分词模式。本文采用精确模式,即把文本进行精确切分,不存在冗余单词,适合文本分析。具体方法为:jieba.cut(s,cut_all=False)。s指需要分词的字符串;cut_all=False指采用精确模式,若为True即为全模式。将分词后数据另存。分词后如表1所示。