《表2 标签:基于字序列的非结构化简历信息解析方法》

《表2 标签:基于字序列的非结构化简历信息解析方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于字序列的非结构化简历信息解析方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

文中采用的数据集是从多家上市公司的招股书中获取的非结构化的10 000份董监高简介信息,共979 180个字符,这些数据包含董监高人物信息(姓名,性别,国籍,出生日期等)以及相关的经历(曾任公司,曾任职位,现任公司,现任职位,毕业院校等)。其中将获得的数据进行人工标注,即为所需关注的信息元制定相应的标签,其中人工制定规范化的标签类型分为14类。即“pers.name”、“org.company”等相应的标签类型对应相应的13类信息元实体和“O”代表的不需要关注的信息实体,标签见表2。