《表2 ppo-pen、ppo-clip及同步并行、异步并行组合训练在测试轨迹上的总回报均值》

《表2 ppo-pen、ppo-clip及同步并行、异步并行组合训练在测试轨迹上的总回报均值》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于强化学习的DASH自适应码率决策算法研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

选用ppo-pen、ppo-clip和同步并行、异步并行组合训练，输出四种方法下在测试轨迹集上的总回报均值，如表2所示。

图表编号	XD00145300000 严禁用于非法目的
绘制时间	2020.04.25
作者	冯苏柳、姜秀华
绘制单位	中国传媒大学信息与通信工程学院、中国传媒大学信息与通信工程学院
更多格式	高清、无水印（增值服务）

查看“表2 ppo-pen、ppo-clip及同步并行、异步并行组合训练在测试轨迹上的总回报均值”的人还看了

: 表2 测试集：变异策略感知的并行模糊测试研究

: 表1 常用符号说明：面向模型并行训练的模型拆分策略自动生成方法

: 表1 动力特性：基于多核并行计算的永磁同步电机有限集模型预测控制策略

: 表2 数据类型及数据量：多航天器异地协同并行测试平台设计

: 表2 连体电机主要参数：一种定子连体双转子同步并行直驱永磁电机

: 表1 连体电机绕组分相：一种定子连体双转子同步并行直驱永磁电机

《表7 投资策略影响因素回归结果

《表8 投资策略选择的投资绩效回