《表1 标签类型:基于特征融合的中文简历解析方法研究》
本文实验所采用的数据是从多家上市公司的招股书中获得非结构化的10 000份董监高简历信息,共979 180个字符。每一份董监高简历信息均包含董监高的姓名、性别、国籍、学历、教育经历、工作经历等信息。将获得的数据进行格式清洗,然后利用标注工具对所需要关注的信息元标注相应的实体标签。本文将所需关注的实体标签分为14类,即“pers.male”“gsp.pos”等需要关注的实体标签。“O”标签为本文实验中不需要关注的实体标签。具体的标签表如表1。
图表编号 | XD0053259100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.15 |
作者 | 陈毅、符磊、代云霞、张剑 |
绘制单位 | 重庆邮电大学光通信与网络重点实验室、北京大学深圳研究院、深港产学研基地深圳市智能媒体和语音重点实验室、安徽大学计算机智能与信号处理教育部重点实验室、北京大学深圳研究院、深港产学研基地深圳市智能媒体和语音重点实验室、重庆邮电大学光通信与网络重点实验室、北京大学深圳研究院、深港产学研基地深圳市智能媒体和语音重点实验室 |
更多格式 | 高清、无水印(增值服务) |