你在学哪一章,《时光机器》文本预处理相关的? 你可以参考我的,我没有依赖 d2l 模块实现。一方面,d2l 中的 API 不稳定,另一方面,其中 API 的具体实现不够 pythonic。所以自己重写了:
d2l
使用方式:
vocab, corpus = get_vocab_corpus_from_timemachine(token_type=...)