《表3 中心化前后五组词相似度值对比结果》

《表3 中心化前后五组词相似度值对比结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于中心化相似度矩阵的词向量方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为进一步说明中心化的作用,以“lobster”(龙虾)为例,选择了“seafood”(海鲜)“eye”(眼睛)“glass”(玻璃)“boy”(男孩)与“shore”(海岸)这五个词,并观察在中心化前后上述词的相似度变化情况,中心化前后相似度的值如表3所示。观察中心化前后的相似度值不难发现,中心化前每组词的相似度较为接近,分布在0.27~0.35。而在中心化之后则体现出了显著的差异。例如“lobster”与“eye”,“lobster”与“seafood”两组词,在中心化之前,相似度分别为0.323 8与0.327 2。两组词具有较为相近的相似度,即“eye”与“seafood”同“lobster”的语义关系相同,这显然不合理。在中心化之后,“lobster”与“eye”的相似度为-0.001 7,“lobster”与“seafood”的相似度为0.286 8。“eye”与“lobster”从相似变为不相似,两组词的相似度差异明显。由此可见,中心化后能使得相似词的相似程度相对增强,不相似或弱相似词的相似程度相对减弱,相似度矩阵更加合理。中心化前后五组词相似度值对比结果如表3所示。