SpeechTokenizer: Unified Speech Tokenizer for Speech Language Models.

Xin Zhang Dong Zhang Shimin Li Yaqian Zhou Xipeng Qiu

Published in: ICLR (2024)

Keyphrases

language model
speech recognition
word error rate
language modeling
automatic speech recognition
speech signal
error rate
document retrieval
spoken term detection
n gram
retrieval model
probabilistic model
information retrieval
query expansion
test collection
context sensitive
mixture model
language modelling
relevance model
handwriting recognition
ad hoc information retrieval
audio visual
language model for information retrieval
language models for information retrieval
vector space model
statistical language models
passage retrieval
hidden markov models