Publication: Draft & Verify: Lossless Large Language Model Acceleration via Self-Speculative Decoding.