《表1 BP算法和BPTT算法比较》
对于RNN,因为要处理时序数据,所以它采用基于时间的反向传播(Back-Propagation Through Time,BPTT)算法.BPTT算法的基本原理和BP算法相同[8].RNN每一时刻t都会产生一个损失值losst,因此网络的总损失可以表示为L=∑tlosst.在RNN训练过程中,梯度一方面会按照空间结构传播(输出层,隐藏层,输入层),即yt→ht→xt,这种情况与BP算法一致;另一方面,梯度要沿着时间通道传播,即ht→ht-1→…→h1,此时,基于公式(1)循环迭代地计算各层梯度,这也是BPTT算法名称的由来.表1总结了BP算法和BPTT算法的特点和训练过程.
图表编号 | XD00227463400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 刘丹、叶茂 |
绘制单位 | 电子科技大学计算机科学与工程学院、电子科技大学计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |