Generation Meets Verification: Accelerating Large Language Model Inference with Smart Parallel Auto-Correct Decoding.

Published in: CoRR (2024)

Keyphrases