Toward a Holistic Performance Evaluation of Large Language Models Across Diverse AI Accelerators.

Murali Emani Sam Foreman Varuni Sastry Zhen Xie Siddhisanket Raskar William Arnold Rajeev Thakur Venkatram Vishwanath Michael E. Papka Sanjif Shanmugavelu Darshan Gandhi Hengyu Zhao Dun Ma Kiran Ranganath Rick Weisner Jiunn-yeu Chen Yuting Yang Natalia Vassilieva Bin C. Zhang Sylvia Howland Alexander Tsyplikhin

Published in: IPDPS (Workshops) (2024)