《表2 PILCO算法伪代码》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《PILCO框架对飞行姿态模拟器系统的参数设计与优化》
PILCO算法可以被分成三个层次,图3给出了PILCO算法的流程图。底层是利用现有数据,使用高斯过程回归的方法拟合出扩张状态[xu]与差分序列Δt=xt-xt-1+ε之间的函数关系,即概率动力学模型。中间层通过计算值函数进行策略评估,紧接着顶层利用共轭梯度(Conjugate Gradient Method,CG)或者随机梯度法(Random Gradient Method,RG)进行策略的优化,如此反复迭代来实现系统控制器的优化。表2中给出了PILCO算法实现的伪代码。
图表编号 | XD002118900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 杨烨峰、邓凯、左英琦、班晓军、黄显林 |
绘制单位 | 哈尔滨工业大学控制理论与制导技术研究中心、四川航天系统工程研究所、哈尔滨工业大学控制理论与制导技术研究中心、哈尔滨工业大学控制理论与制导技术研究中心、哈尔滨工业大学控制理论与制导技术研究中心 |
更多格式 | 高清、无水印(增值服务) |