Mask More and Mask Later: Efficient Pre-training of Masked Language Models by Disentangling the [MASK] Token.

Published in: EMNLP (Findings) (2022)

Keyphrases