《表1 职位语料库:基于扩展规则与统计特征的未登录词识别》
通过网络爬虫从招聘网站爬取招聘职位,建立职位语料库。招聘职位如图1所示。职位语料库如表1所示。职位通常由结构化数据和非结构化数据两部分组成。结构化数据包括职位月薪、工作地点、发布时间等字段及相应内容,通常由若干字描述;非结构化数据包括岗位职责、任职要求、福利待遇等。职位信息主要集中在非结构化数据。因此在本文后续工作中,关于职位的处理指的是对其非结构化数据的处理。
图表编号 | XD0067702100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 曾浩、詹恩奇、郑建彬、汪阳 |
绘制单位 | 武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室、武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |