《表3 式(30)所示执行器模糊规则的初始参数》

《表3 式(30)所示执行器模糊规则的初始参数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《二自由度飞行姿态模拟器的模糊强化学习控制》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从图4~图7中可看出,经过迭代学习过程,得到的具有最优控制策略参数的控制器,能够使得二自由度飞行模拟器的俯仰角和角速度均稳定在0度。从图8和图9中,可以看到评价器参数收速度较快,且所得到的TD误差为零,即实现了值函数最小化的性能指标。该仿真结果不仅说明多项式T-S模糊模型近似值函数是可行的,此外,基于多项式T-S模糊模型的执行器-评价器结构的强化学习策略迭代算法在二自由度飞行模拟器上的应用是成功且有效的。