《表6 与“吴”“鸯”“扒”“蚣”相近的字》

《表6 与“吴”“鸯”“扒”“蚣”相近的字》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于字簇的多模型中文分词方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表4、5中可以看出,在两种语料中使用余弦相似度作为距离度量方式表现出最佳的分词结果。余弦相似度计算的是两个向量夹角的大小,反映两个向量之间的相似程度,而欧氏距离则是度量两个向量之间位置的绝对距离。本文的聚类对象为模型参数,该向量反映了字的上下文特征对该字标注状态的作用程度,代表了该字的构词规律,使用余弦相似度作为距离度量方式更为合理。表6展示了使用余弦相似度作为距离度量方式下的聚类结果。