《表4 不同学习策略的学习速度比较》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种先验知识引导的基于二阶段渐进网络的自主抓取策略》
本文提出一种基于先验知识的引导策略来加快TSPN的学习进程.为了验证该引导策略是否有效,本文将该引导策略与几种传统的自监督学习方法进行比较.自监督学习是指在早期通过抓取尝试来收集样本,并利用这些数据训练模型,之后再通过抓取与学习不断提升自己的抓取能力.按照采样策略的不同,自监督学习可以分为:基于随机采样的学习策略、基于MOG采样的学习策略以及基于先验知识引导的学习策略.随机采样的学习策略是指在学习初期通过随机抓取来收集样本;基于MOG采样的学习策略是指按照深度数据拟合高斯分布进行采样抓取;而特征引导是指在早期通过先验知识引导机器人进行抓取采样.本实验比较了3种学习策略的学习时间,记录不同策略引导下的抓取模型在单个物品上达到80%抓取成功率时所耗费的学习时间.实验结果如表4所示,可以看出,基于先验知识引导的学习策略其学习速率明显领先于其他2种学习策略,这也验证了基于先验知识引导的学习策略是有效的.
图表编号 | XD00197291000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.01 |
作者 | 张森彦、田国会、张营、刘小龙 |
绘制单位 | 山东大学控制科学与工程学院、山东大学控制科学与工程学院、山东大学控制科学与工程学院、山东大学控制科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |