《表2 数据集描述:面向搜索的微博短文本语义建模方法》
采用新浪微博数据作为实验数据集.数据集信息如表2所示.数据集中文档长度的分布如图3所示,通过图3可以看出,新浪微博文本长度主要分布在11~15个字之间,单条文本的长度较短,具有很强的语义稀疏性.
图表编号 | XD00163166000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 寇菲菲、杜军平、石岩松、杨从先、崔婉秋、梁美玉、石磊 |
绘制单位 | 北京邮电大学智能通信软件与多媒体北京市重点实验室、北京邮电大学智能通信软件与多媒体北京市重点实验室、北京邮电大学智能通信软件与多媒体北京市重点实验室、北京邮电大学智能通信软件与多媒体北京市重点实验室、北京邮电大学智能通信软件与多媒体北京市重点实验室、北京邮电大学智能通信软件与多媒体北京市重点实验室、北京邮电大学智能通信软件与多媒体北京市重点实验室 |
更多格式 | 高清、无水印(增值服务) |