《表8 小句关系分析结果:基于词嵌入的书面语篇多层次差异探究》
%
表9对比了百度数据、新闻数据以及微博数据训练出的词嵌入在句群边界模糊一致率的评价标准上的差异,其中百度数据训练出的词嵌入在句群分析中有更为良好的表现,这是因为在百度数据的领域广,词汇分布更加平衡且广泛,在句群边界识别任务中的词嵌入有更好的表现能力。此外,百度数据在三种模型的结果均高于其他数据,这也证明了词汇分布的广泛性对于句群边界分布更为重要,因此百度数据在句群边界分析这一语篇分析任务中更有帮助。同时Glove模型训练出的词嵌入整体表现要好于其他两个模型,因此在句群边界分析这一任务中,更适合使用Glove模型进行词嵌入训练。
图表编号 | XD003714400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 张学敬、吕学强、周强 |
绘制单位 | 北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科学与技术国家研究中心、清华大学信息技术研究院语音和语言技术中心 |
更多格式 | 高清、无水印(增值服务) |