《表1 病原菌分布情况:区级人大报告中的地名自动标注研究》
BERT的训练数据有一定的格式要求,一般每行一个token,一句话由多行token构成,多个句子之间用空行分开。其中每行又分成2列,每行的第一列是字,后一列是标注符号,使用空格分隔。对训练数据采用“B-LOC”、“I-LOC”和“O”标注。标注符号及含义如表1所示。
图表编号 | XD00183552900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 喻航、李红莲、吕学强 |
绘制单位 | 北京信息科技大学信息与通信工程学院、北京信息科技大学信息与通信工程学院、北京信息科技大学网络文化与数字传播北京市重点实验室 |
更多格式 | 高清、无水印(增值服务) |