《表2 深度强化学习算法各业务对应路径》
经过学习之后,对模型进行保存,然后再进行测试,网络会寻找到相对理想的路径,对于这5条业务而言,算法找到的最优路径见表2.其中表格最后一列表示时延代价,括号里面表示最小时延代价.可以看出,各自的时延并不一定是最小的,但是综合平均时延和网络负载均衡度可以使目标函数达到理想值,整体收益尽可能好.
图表编号 | XD00145423500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 马庆刘、喻鹏、吴佳慧、熊翱、颜拥 |
绘制单位 | 北京邮电大学网络与交换技术国家重点实验室、北京邮电大学网络与交换技术国家重点实验室、北京邮电大学网络与交换技术国家重点实验室、北京邮电大学网络与交换技术国家重点实验室、国网浙江省电力有限公司 |
更多格式 | 高清、无水印(增值服务) |