《表2 部分汉语文本聚类频率最高的10个词》

《表2 部分汉语文本聚类频率最高的10个词》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LDA的英汉维文本聚类系统的设计与实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

所以用较多的时间来计算聚类最优的种类,通过实验可以发现,在LDA模型下,直接生成的话题簇可以代表聚类种类。在表2~表4中罗列了汉语文本、维吾尔语文本及英语文本聚类后,词频最高的前10个词,可以直观地发现,这些词都有紧密的联系,放在一起,就可以作为一类文本的特征词用于检索更进一步的任务。