A Task-Efficient Gradient Guide Knowledge Distillation for Pre-train Language Model Compression.

Xu Liu Yila Su Nier Wu

Published in: ICIC (LNAI 3) (2024)

Keyphrases

language model
language modeling
n gram
probabilistic model
speech recognition
document retrieval
query expansion
retrieval model
mixture model
information retrieval
language modelling
test collection
prior knowledge
relevance model
smoothing methods
statistical language models
language models for information retrieval
language model for information retrieval
information retrieval systems
information extraction
context sensitive
natural language
cross lingual
vector space model
tf idf
machine learning