《表1 职位语料库:基于扩展规则与统计特征的未登录词识别》

《表1 职位语料库:基于扩展规则与统计特征的未登录词识别》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于扩展规则与统计特征的未登录词识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

通过网络爬虫从招聘网站爬取招聘职位,建立职位语料库。招聘职位如图1所示。职位语料库如表1所示。职位通常由结构化数据和非结构化数据两部分组成。结构化数据包括职位月薪、工作地点、发布时间等字段及相应内容,通常由若干字描述;非结构化数据包括岗位职责、任职要求、福利待遇等。职位信息主要集中在非结构化数据。因此在本文后续工作中,关于职位的处理指的是对其非结构化数据的处理。