《表6 独白语篇与对话语篇字词统计》
表6的统计数据显示,在独白语篇中,出现最多的是正式且官方的词汇,而在对话语篇中出现的词汇则较为随意,比较日常化。但是以字为统计单位时,用字的差异明显弱化,以字为单位的统计结果显示出现频率最高的部分字有大部分重合,这也意味着在使用字向量作为任务数据表示的情况下,数据的差异会弱化。独白语篇与对话语篇在字词的差异主要体现在词汇表达上。
图表编号 | XD003715400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 张学敬、吕学强、周强 |
绘制单位 | 北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科技大学网络文化与数字传播北京市重点实验室、北京信息科学与技术国家研究中心、清华大学信息技术研究院语音和语言技术中心 |
更多格式 | 高清、无水印(增值服务) |