《表3 样本类别和数量统计信息》
为了测试提出模型的有效性,本文选用了IDeepWise数据集,该数据集是对SMP2017数据集的扩充和补充。涉及到订票类、天气类、音乐类、闲聊类等13个领域。采用预处理技术对数据进行了缺失值处理、错误字符纠正、数据类别合并、停用词处理,去重等操作最终得到53 117条样本,每种类别样本数量和对应的类别标签如表3所示。
图表编号 | XD0054910200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.01 |
作者 | 杨志明、王来奇、王泳 |
绘制单位 | 中国科学院软件研究所、中国科学院大学、深思考人工智能机器人科技(北京)有限公司、深思考人工智能机器人科技(北京)有限公司、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |