《表3 训练数据:基于伪标注样本融合的领域分词方法》
为尽可能地多保留训练样本依据样本语句的长度众数,将句长统一为100,即将过长的语句剔除,并使用字符“0”对不足的语句进行填充。最终的训练数据大小,见表3。
图表编号 | XD00207697300 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.20 |
作者 | 胡潇涛、吴浩、杨亮、顾小平、宋弘 |
绘制单位 | 四川轻化工大学自动化与信息工程学院、四川轻化工大学自动化与信息工程学院、人工智能四川省重点实验室、四川轻化工大学自动化与信息工程学院、四川轻化工大学自动化与信息工程学院、四川轻化工大学自动化与信息工程学院、人工智能四川省重点实验室 |
更多格式 | 高清、无水印(增值服务) |