FastDecode: High-Throughput GPU-Efficient LLM Serving using Heterogeneous Pipelines.

Jiaao He Jidong Zhai

Published in: CoRR (2024)

Keyphrases

high throughput
genome wide
microarray
low latency
biological data
systems biology
dna sequencing
genomic data
databases
machine learning
proteomic data
data mining
data acquisition
real time
data model
mass spectrometry