《表5 词嵌入向量语义相似度》
为了引入词嵌入向量,对较大的文本语料库进行词素切分,然后对每个词素计算stem2vector向量值。其中,维吾尔语文本是500 000个句子,哈萨克语200 000个句子。选择上下文10个单元(词素),在维吾尔语和哈萨克语中将所有词素单元映射到8维实数向量空间,并用余弦距离测量每个单元的相似度。表5给出了几个词干的相似度,其中分别为对维吾尔语词m Akt Ap(学校)和哈萨克语词xenjya N(新疆)一些相似词的余弦距离。
图表编号 | XD00220156800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.15 |
作者 | 穆凯代姆罕·伊敏江、沙尔旦尔·帕尔哈提、艾斯卡尔·艾木都拉、米吉提·阿不里米提 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学信息科学与工程学院、新疆大学信息科学与工程学院、新疆大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |