《表3 四种不同的时间序列长度在测试轨迹上的总回报均值》

《表3 四种不同的时间序列长度在测试轨迹上的总回报均值》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于强化学习的DASH自适应码率决策算法研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

输入状态的时间序列长度slen分别设置为1，4，8，16，采用ppo-clip及同步并行训练，输出这四种设置在测试轨迹上的总回报均值，如表3所示。

图表编号	XD00145299800 严禁用于非法目的
绘制时间	2020.04.25
作者	冯苏柳、姜秀华
绘制单位	中国传媒大学信息与通信工程学院、中国传媒大学信息与通信工程学院
更多格式	高清、无水印（增值服务）

查看“表3 四种不同的时间序列长度在测试轨迹上的总回报均值”的人还看了

: 表4 各算法在不同维度DTLZ测试集上的平均运行时间对比

: 表3 不同时间步长上的转矩系数均值

: 表3 NUSWIDE数据集上对不同哈希编码长度的测试平均精度均值

: 表种算法在测试集上的、γ和的均值及方差

: 表3 5种算法在DTLZ测试集上的平均IGD均值及标准差

: 表2 不同深度网络模型在测试集上的评价指标平均值

《表2 全样本主要变量描述性统计

《表7 投资策略影响因素回归结果