《表4 房间新词互信息变化前10 (按边界增强上下文熵排序)》
从图5中可见,语料范围及规模变化对每个具体新词的互信息造成影响并不均匀,但图6表明,小规模语料中互信息的分布在低位较大规模的情形更多。因此,随语料规模增大而选择较大的tg值,可使算法保持良好效果。按EntBB(w)降序排序所有直播间内新词,对比其在完整语料中的互信息Grp(w)与房间内互信息Grp'(w),如表4所示。
图表编号 | XD007605000 严禁用于非法目的 |
---|---|
绘制时间 | 2018.07.20 |
作者 | 王雪瑞、刘渊 |
绘制单位 | 江南大学数字媒体学院、江南大学数字媒体学院 |
更多格式 | 高清、无水印(增值服务) |