《表2 PILCO算法伪代码》

《表2 PILCO算法伪代码》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《PILCO框架对飞行姿态模拟器系统的参数设计与优化》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

PILCO算法可以被分成三个层次,图3给出了PILCO算法的流程图。底层是利用现有数据,使用高斯过程回归的方法拟合出扩张状态[xu]与差分序列Δt=xt-xt-1+ε之间的函数关系,即概率动力学模型。中间层通过计算值函数进行策略评估,紧接着顶层利用共轭梯度(Conjugate Gradient Method,CG)或者随机梯度法(Random Gradient Method,RG)进行策略的优化,如此反复迭代来实现系统控制器的优化。表2中给出了PILCO算法实现的伪代码。