关于注意力机制代码实现中softmax方向的问题

为什么这里softmax的方向axis=1呢?
按照下面老师所画的图来看,应该是对axis=0来做softmax才对啊。