《表1 维吾尔语停用词:基于LDA主题模型的维吾尔语无监督词义消歧》
本文中,停用词主要包括数字、字母、符号和高频维吾尔语词汇.其中,高频维吾尔语词汇是在35万句维吾尔语语料的词频统计数据中过滤得到的,人工过滤词频数高于5 000的词汇作为停用词.最终整理出的维吾尔语停用词如表1所示.
图表编号 | XD00140614900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.28 |
作者 | 袁扬、李晓、杨雅婷 |
绘制单位 | 中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室 |
更多格式 | 高清、无水印(增值服务) |