序列到序列学习(seq2seq)

http://zh-v2.d2l.ai/chapter_recurrent-modern/seq2seq.html

9.7.5 的预测代码中

每个时间步调用一次decoder, 其中的dec_state参数随时间步变化而更新,那么decoder中的context变量会根据dec_state的变化而变化,不再是encoder中的上下文信息。这里是不是一个bug,求解惑~