TencentLLMEval: A Hierarchical Evaluation of Real-World Capabilities for Human-Aligned LLMs.

Shuyi Xie Wenlin Yao Yong Dai Shaobo Wang Donlin Zhou Lifeng Jin Xinhua Feng Pengzhi Wei Yujie Lin Zhichao Hu Dong Yu Zhengyou Zhang Jing Nie Yuhong Liu

Published in: CoRR (2023)