Topic | Replies | Views | Activity | |
---|---|---|---|---|
小批量随机梯度下降 |
![]() |
0 | 535 | November 22, 2022 |
随机梯度下降 |
![]() |
0 | 697 | November 22, 2022 |
梯度下降 |
![]() |
0 | 713 | November 22, 2022 |
凸性 |
![]() |
0 | 624 | November 22, 2022 |
优化和深度学习 |
![]() |
0 | 729 | November 22, 2022 |
Transformer |
![]() |
0 | 600 | November 22, 2022 |
自注意力和位置编码 |
![]() |
0 | 606 | November 22, 2022 |
多头注意力 |
![]() |
0 | 768 | November 22, 2022 |
Bahdanau 注意力 |
![]() |
0 | 575 | November 22, 2022 |
注意力评分函数 |
![]() |
0 | 598 | November 22, 2022 |
注意力汇聚:Nadaraya-Watson 核回归 |
![]() |
0 | 910 | November 22, 2022 |
注意力提示 |
![]() |
0 | 657 | November 22, 2022 |
序列到序列学习 |
![]() |
0 | 676 | November 22, 2022 |
编码器-解码器架构 |
![]() |
0 | 622 | November 22, 2022 |
机器翻译与数据集 |
![]() |
0 | 560 | November 22, 2022 |
双向循环神经网络 |
![]() |
0 | 638 | November 22, 2022 |
深度循环神经网络 |
![]() |
0 | 553 | November 22, 2022 |
长短期记忆网络(LSTM) |
![]() |
0 | 758 | November 22, 2022 |
自然语言推断:使用注意力 |
![]() |
0 | 548 | November 21, 2022 |
自然语言推断与数据集 |
![]() |
0 | 893 | November 21, 2022 |
情感分析:使用卷积神经网络 |
![]() |
0 | 684 | November 21, 2022 |
情感分析:使用循环神经网络 |
![]() |
0 | 563 | November 21, 2022 |
情感分析及数据集 |
![]() |
0 | 602 | November 21, 2022 |
预训练BERT |
![]() |
0 | 668 | November 21, 2022 |
用于预训练BERT的数据集 |
![]() |
0 | 625 | November 21, 2022 |
来自Transformers的双向编码器表示(BERT) |
![]() |
0 | 681 | November 21, 2022 |
词的相似性和类比任务 |
![]() |
0 | 628 | November 21, 2022 |
子词嵌入 |
![]() |
0 | 585 | November 21, 2022 |
预训练word2vec |
![]() |
0 | 758 | November 21, 2022 |
用于预训练词嵌入的数据集 |
![]() |
0 | 693 | November 21, 2022 |