《表1 数据集的神灵名称分布情况》
本文对所有语料进行单字切分,并按照BMEO标注策略进行标注。由于藏传佛教命名实体识别的标注语料规模较小,本文按照6:2:2的比例划分训练集、验证集和测试集。数据集中的神灵名称实体按照长度进行划分,具体分布情况如表1所示。
图表编号 | XD00204762400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 郭晓然、王维兰、罗平 |
绘制单位 | 西北民族大学数学与计算机科学学院、西北民族大学中国民族语言文字信息技术教育部重点实验室、兰州交通大学电子与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |