https://zh-v2.d2l.ai/chapter_multilayer-perceptrons/backprop.html
注意,反向传播复⽤正向传播中存储的中间值,以避免重复计算。
请问正向传播中会存储什么中间值?
反向传播中所需要用到的值,就是公式推导中的偏导数
我觉得不是偏导,而是如 (4.7.11) 式中的 h^T 一样,存储的是正向传播计算出来的中间值
感觉就比如反向求导的时候对x^2求导为2x,在计算这个导数的时候,可以直接用正向传播中存储的x的值
注意,反向传播复⽤正向传播中存储的中间值,以避免重复计算。
请问正向传播中会存储什么中间值?
反向传播中所需要用到的值,就是公式推导中的偏导数
我觉得不是偏导,而是如 (4.7.11) 式中的 h^T 一样,存储的是正向传播计算出来的中间值
感觉就比如反向求导的时候对x^2求导为2x,在计算这个导数的时候,可以直接用正向传播中存储的x的值