A Proposed S.C.O.R.E. Evaluation Framework for Large Language Models : Safety, Consensus, Objectivity, Reproducibility and Explainability.

Ting Fang Tan Kabilan Elangovan Jasmine Chiat Ling Ong Nigam Shah Joseph Jao-Yiu Sung Tien Yin Wong Lan Xue Nan Liu Haibo Wang Chang Fu Kuo Simon Chesterman Zee Kin Yeong Daniel S. W. Ting

Published in: CoRR (2024)