Catwalk: A Unified Language Model Evaluation Framework for Many Datasets.

Dirk Groeneveld Anas Awadalla Iz Beltagy Akshita Bhagia Ian Magnusson Hao Peng Oyvind Tafjord Pete Walsh Kyle Richardson Jesse Dodge

Published in: CoRR (2023)