A 7-nm Four-Core Mixed-Precision AI Chip With 26.2-TFLOPS Hybrid-FP8 Training, 104.9-TOPS INT4 Inference, and Workload-Aware Throttling.

Sae Kyu Lee Ankur Agrawal Joel Silberman Matthew M. Ziegler Mingu Kang Swagath Venkataramani Nianzheng Cao Bruce M. Fleischer Michael Guillorn Matthew Cohen Silvia M. Mueller Jinwook Oh Martin Lutz Jinwook Jung Siyu Koswatta Ching Zhou Vidhi Zalani Monodeep Kar James Bonanno Robert Casatuta Chia-Yu Chen Jungwook Choi Howard Haynie Alyssa Herbert Radhika Jain Kyu-Hyoun Kim Yulong Li Zhibin Ren Scot Rider Marcel Schaal Kerstin Schelm Michael Scheuermann Xiao Sun Hung Tran Naigang Wang Wei Wang Xin Zhang Vinay Shah Brian W. Curran Vijayalakshmi Srinivasan Pong-Fei Lu Sunil Shukla Kailash Gopalakrishnan Leland Chang

Published in: IEEE J. Solid State Circuits (2022)