《表1 依存句法规则下英文长短句变化情况》

《表1 依存句法规则下英文长短句变化情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于依存句法的句子相似度计算方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

应用上述长短句提取规则,作用于本文选用的2个公开实验数据集MSRP和STS,其长短句数量变化情况见表1。由表1可知,MSRP数据集的句长小于12的句子从821条减少到484条,长度超过20的句子减少了2405条。STS数据集的短句子过多而且大多只有5个单词,短句子的语义信息过少不利于提取出句子的特征,通过本文提出的依存句法提取规则,补充短句语义信息使短句减少了151条。2个数据集所减少的长句和短句都分别在句长适中的区间相应的增加了2 742条和2 261条。