用于预训练BERT的数据集

https://zh.d2l.ai/chapter_natural-language-processing-pretraining/bert-dataset.html