《表3 式(30)所示执行器模糊规则的初始参数》
从图4~图7中可看出,经过迭代学习过程,得到的具有最优控制策略参数的控制器,能够使得二自由度飞行模拟器的俯仰角和角速度均稳定在0度。从图8和图9中,可以看到评价器参数收速度较快,且所得到的TD误差为零,即实现了值函数最小化的性能指标。该仿真结果不仅说明多项式T-S模糊模型近似值函数是可行的,此外,基于多项式T-S模糊模型的执行器-评价器结构的强化学习策略迭代算法在二自由度飞行模拟器上的应用是成功且有效的。
图表编号 | XD00800300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 任立伟、班晓军、吴奋、黄显林 |
绘制单位 | 哈尔滨工业大学控制理论与制导技术研究中心、哈尔滨工业大学控制理论与制导技术研究中心、Department of Mechanical and Aerospace Engineering,North Carolina State University、哈尔滨工业大学控制理论与制导技术研究中心 |
更多格式 | 高清、无水印(增值服务) |