《表2 数据集输入句子形式》

《表2 数据集输入句子形式》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于双向LSTM的联合学习的中文分词方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验时随机选择训练数据中90%的数据作为训练集,剩下10%作为开发集。所有的数据在输入前需要经过预处理,将中文习语替换成*,英文单词替换成&,数字替换成$,在大规模的无标注的语料上进行字向量训练,将训练完成的字向量作为本次实验的词向量。将每个数据集的输入语句都添加各自的标志符,不同数据集带有标志符的句子形式示例如表2所示。当计算最终输出的分值时不计算标志符。为了便于评估,本文使用标准bake-off打分程序来计算准确率P、召回率R、F1分值。