Sparse Autoencoders Find Highly Interpretable Features in Language Models.

Hoagy Cunningham Aidan Ewart Logan Riggs Robert Huben Lee Sharkey

Published in: CoRR (2023)

Keyphrases

language model
language modeling
probabilistic model
n gram
document retrieval
information retrieval
retrieval model
language modelling
speech recognition
smoothing methods
test collection
statistical language models
co occurrence
ad hoc information retrieval
context sensitive
language models for information retrieval
document ranking
vector space model
query expansion
image features
relevance model
term dependencies
pseudo relevance feedback
classification accuracy
language model for information retrieval