用于预训练BERT的数据集

http://zh-v2.d2l.ai/chapter_natural-language-processing-pretraining/bert-dataset.html