DynaMo: Accelerating Language Model Inference with Dynamic Multi-Token Sampling.

Shikhar Tuli Chi-Heng Lin Yen-Chang Hsu Niraj K. Jha Yilin Shen Hongxia Jin

Published in: NAACL-HLT (2024)