《表6 与“吴”“鸯”“扒”“蚣”相近的字》
从表4、5中可以看出,在两种语料中使用余弦相似度作为距离度量方式表现出最佳的分词结果。余弦相似度计算的是两个向量夹角的大小,反映两个向量之间的相似程度,而欧氏距离则是度量两个向量之间位置的绝对距离。本文的聚类对象为模型参数,该向量反映了字的上下文特征对该字标注状态的作用程度,代表了该字的构词规律,使用余弦相似度作为距离度量方式更为合理。表6展示了使用余弦相似度作为距离度量方式下的聚类结果。
图表编号 | XD00134597300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 李对红、王裴岩、张桂平、张少阳 |
绘制单位 | 沈阳航空航天大学人机智能研究中心、沈阳航空航天大学人机智能研究中心、沈阳航空航天大学人机智能研究中心、沈阳航空航天大学人机智能研究中心 |
更多格式 | 高清、无水印(增值服务) |