MedCalc-Bench: Evaluating Large Language Models for Medical Calculations.

Nikhil Khandekar Qiao Jin Guangzhi Xiong Soren Dunn Serina S. Applebaum Zain Anwar Maame Sarfo-Gyamfi Conrad W. Safranek Abid A Anwar Andrew Zhang Aidan Gilson Maxwell B. Singer Amisha D. Dave Andrew Taylor Aidong Zhang Qingyu Chen Zhiyong Lu

Published in: CoRR (2024)