mini-batch 喂入模型数据的时候要保证mini-batch中句子长度一致,但是对于较短的句子,就需要使用特定的字符进行填充到统一的句子长度。但是我们不希望其填充的pad数据(一般为0)进入GRU或是LSTM模块,一是浪费资源,二是可能造成句子表征不准确。所以pack_padded_sequence 类应运而生。主要是对填充过的数据进行压缩。
文章中什么时候把这一块加上呢?
mini-batch 喂入模型数据的时候要保证mini-batch中句子长度一致,但是对于较短的句子,就需要使用特定的字符进行填充到统一的句子长度。但是我们不希望其填充的pad数据(一般为0)进入GRU或是LSTM模块,一是浪费资源,二是可能造成句子表征不准确。所以pack_padded_sequence 类应运而生。主要是对填充过的数据进行压缩。
文章中什么时候把这一块加上呢?