AD-KD: Attribution-Driven Knowledge Distillation for Language Model Compression.

Siyue Wu Hongzhan Chen Xiaojun Quan Qifan Wang Rui Wang

Published in: ACL (1) (2023)

Keyphrases

language model
language modeling
document retrieval
n gram
language modelling
speech recognition
information retrieval
probabilistic model
retrieval model
context sensitive
ad hoc information retrieval
query expansion
mixture model
test collection
translation model
statistical language models
prior knowledge
vector space model
relevance model
relevance feedback
query terms
information extraction
statistical machine translation
smoothing methods
bayesian networks
document length
feature selection