http://zh-v2.d2l.ai/chapter_natural-language-processing-applications/sentiment-analysis-cnn.html
这个地方说是用最大池化,但是用成平均的了
采用类似自然语言推断的bert微调的方法,对二分类进行bert微调,出现了过拟合。
作者的cnn结果也是过拟合,应该怎么修改呢?
现在是词的长度是宽,embedding长度是高吗?我以前看到的都是sequence_length x embedding_size,好困惑啊。还有
对比了最大汇聚和平均汇聚,最大汇聚效果更好写,7个epoch下test acc 0.871