《表3 标注标签及说明[15]》
实验数据通过自定义爬虫从“巨潮资讯网”上抓取2000篇上市公司并购重组类公告文本,其中训练集为1600篇、验证集和测试集分别为200篇。选取当前较为常用的BIO(begin,inside,outside)书签机制进行标注。在此基础上增加E(end)标签和S(single)标签对包含“交易标的”、“成交金额”在内的12个字段进行语料标注,以方便对标签实体的解析。标注标签及说明见表3。其中S标签表示由单个词组成的实体,O标签表示其它类型的实体,B标签表示目标实体的首个词,I标签为其中间词汇,E标签表示目标实体的最后一个词汇[15]。
图表编号 | XD00170286100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.16 |
作者 | 黄胜、李胜、朱菁 |
绘制单位 | 重庆邮电大学通信与信息工程学院、重庆邮电大学光通信与网络重点实验室、重庆邮电大学通信与信息工程学院、重庆邮电大学光通信与网络重点实验室、深圳证券信息有限公司数据中心 |
更多格式 | 高清、无水印(增值服务) |