《表4 热词分布:基于热词语义聚类的领域特征挖掘方法》
本文取t1=70%,t2=30%,对于每个簇i,i=1,2,…,l,满足pi(wij)≥70%的热词aij为该簇的高频词,满足70%>pi(wij)≥30%的热词aij为该簇的中频词,满足pi(wij)<30%的热词aij为该簇的低频词。由于本文的目标是挖掘领域特征,因此本文主要考虑中频词和高频词,同时为了保证热词在整个领域中具有代表性,本文还要求aij满足n(wij)≥0.3×max{n(wij)|aij∈GL}。所提取的旅游热词的词频分布见表4。
图表编号 | XD0082516000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 庄建昌、武娇、顾兴全、洪彩凤 |
绘制单位 | 中国计量大学理学院、中国计量大学理学院、中国计量大学标准化学院、中国计量大学理学院 |
更多格式 | 高清、无水印(增值服务) |