D2L Discussion
来自 Transformers (BERT) 的双向编码器表示
中文版
pytorch
wangyifan97
September 23, 2021, 11:43am
1
为什么Bert里的embedding不需要缩放?