《表4 基于模型行为克隆方法的优点和局限性》
相对于基于模型的BC方法,无模型的BC方法因为不需学习系统动力学,所以不需迭代学习,容易实现。但是,在学习轨迹时,无模型BC并不能保证在给定系统中所学轨迹的适用性。为此,难以将无模型方法应用于可达到状态集受限的欠驱动系统中。与无模型BC方法相反,基于模型的BC方法应用系统动力学的信息学习策略。即使在欠驱动的状态下,通过学习前向模型,基于模型的行为克隆方法也可以找到近似于专家行为的合适的轨迹。但是,学习前向模型不是一件容易的工作,并且基于模型的BC方法常常需要迭代学习,时间成本和计算成本较大。表4总结了本文中基于模型行为克隆方法的优点和局限性。
图表编号 | XD0035438700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.15 |
作者 | 李帅龙、张会文、周维佳 |
绘制单位 | 中国科学院沈阳自动化研究所机器人学国家重点实验室、中国科学院机器人与智能制造创新研究院、中国科学院大学、中国科学院沈阳自动化研究所机器人学国家重点实验室、中国科学院机器人与智能制造创新研究院、中国科学院大学、中国科学院沈阳自动化研究所机器人学国家重点实验室、中国科学院机器人与智能制造创新研究院 |
更多格式 | 高清、无水印(增值服务) |