《表6 冷门搜索词扩展对比实验》
在冷门词语中,发现Word2vec的部分扩展词汇呈现出一种混乱的表现,而本文模型却表现依然稳定,甚至更加出众。如表6所示,当对“马虎”和“村寨”进行扩展时,Word2vec的扩展效果不尽如人意。可以看出,由于冷门词语在语料中出现的频率较低,获得的训练效果较差,并且Word2vec倾向将待扩展词扩展为训练语料中上下文相关的词语,如“村寨”与“少数民族”,此时语义相关模型的扩展效果便更加突出。
图表编号 | XD00189091400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.10 |
作者 | 刘高军、方晓、段建勇 |
绘制单位 | 北方工业大学信息学院、北方工业大学信息学院、北方工业大学信息学院 |
更多格式 | 高清、无水印(增值服务) |