《表2 部分通用词抽取结果》
将预处理后的3GPP技术规范利用2.1节基于词频-文档分布熵的方法构建通用词表,经过多次实验得出词频-文档分布熵最佳阈值为4.42,选取熵值大于阈值的词作为通用词,总共获得13 566个通用词,部分通用词抽取结果见表2。
图表编号 | XD0040532200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.16 |
作者 | 李欢、吕学强、李宝安、徐丽萍 |
绘制单位 | 北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科技大学网络文化与数字传播北京市重点实验室、北京城市系统工程研究中心 |
更多格式 | 高清、无水印(增值服务) |