《表1 无线网络参数取值:基于深度强化学习的无线网络资源分配算法》
为了证实DQN算法在复杂网络环境能否取得良好的效果,本文模拟多信道接入无线网络环境建立模型,随机选取30个节点组成15条通信链路,设置4个可选择信道,功率组合为2 mW、5 mW和9 mW。因此,动作空间的大小为12。本文构建的仿真模型和深度强化学习均由Python实现,并且基于TensorFlow、Gym和Keras设计和训练了DQN算法。本实验的网络参数和深度强化学习算法参数取值如表1和表2所示。训练所使用的神经网络为全连接神经网络,包含2个隐含层,每个隐含层分别拥有256和9个神经元。每个神经元使用的激活函数为修正线性单元(ReLU)。折扣因子的大小决定了算法对当前回报和未来回报的重视程度,折扣因子越小,算法越倾向于短期的高收益。由于本实验中需要连续做出一系列的动作,为了获得更加长期的高额回报,本文将折扣因子设置为0.9。
图表编号 | XD00156313900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.10 |
作者 | 李孜恒、孟超 |
绘制单位 | 安徽理工大学计算机科学与工程学院、金陵科技学院网络与通信工程学院 |
更多格式 | 高清、无水印(增值服务) |