《表1 符号解释:双学习率自适应的Q路由算法》

《表1 符号解释:双学习率自适应的Q路由算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《双学习率自适应的Q路由算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

整个算法分为轮询(Echo)和转发(Transfer)两个阶段,算法启动时初始化每个节点的Q表的所有项为0.当一个packet到达某个节点时,首先进入轮询阶段,节点通过独立信道向所有邻居节点发出请求,获取该节点与每个邻居节点间的延迟信息,然后利用所有邻居节点反馈的延迟值更新本节点Q表.接下来进入转发阶段,节点查看Q表并选择当前状态s下Q值最低的邻居节点作为下一跳选择;随后,节点执行转发操作,并存储下一跳节点反馈的reward信息;下一步,更新转发学习率ηt并利用此学习率更新本节点Q表;最后更新轮询学习率ηe.具体如算法1所示.其中参数见表1.