《表2 深度强化学习算法各业务对应路径》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于深度强化学习的综合能源业务通道优化机制》

经过学习之后，对模型进行保存，然后再进行测试，网络会寻找到相对理想的路径，对于这5条业务而言，算法找到的最优路径见表2．其中表格最后一列表示时延代价，括号里面表示最小时延代价．可以看出，各自的时延并不一定是最小的，但是综合平均时延和网络负载均衡度可以使目标函数达到理想值，整体收益尽可能好．

图表编号	XD00145423500 严禁用于非法目的
绘制时间	2020.04.01
作者	马庆刘、喻鹏、吴佳慧、熊翱、颜拥
绘制单位	北京邮电大学网络与交换技术国家重点实验室、北京邮电大学网络与交换技术国家重点实验室、北京邮电大学网络与交换技术国家重点实验室、北京邮电大学网络与交换技术国家重点实验室、国网浙江省电力有限公司
更多格式	高清、无水印（增值服务）