D2L Discussion
关于注意力机制代码实现中softmax方向的问题
中文版
Pats666
December 10, 2021, 1:34pm
1
屏幕截图 2021-12-10 213203
1095×836 313 KB
为什么这里softmax的方向axis=1呢?
按照下面老师所画的图来看,应该是对axis=0来做softmax才对啊。