Professional Certification Benchmark Dataset: The First 500 Jobs For Large Language Models.

David Noever Matthew Ciolino

Published in: CoRR (2023)

Keyphrases

benchmark datasets
language model
language modeling
n gram
document retrieval
retrieval model
speech recognition
probabilistic model
information retrieval
language modelling
query expansion
test collection
language models for information retrieval
document ranking
translation model
context sensitive
ad hoc information retrieval
vector space model
statistical language models
query terms
pedestrian detection
evaluation measures
pseudo relevance feedback
relevance model
smoothing methods
word error rate