BioHanBERT: A Hanzi-aware Pre-trained Language Model for Chinese Biomedical Text Mining.

Xiaosu Wang Yun Xiong Hao Niu Jingwen Yue Yangyong Zhu Philip S. Yu

Published in: ICDM (2021)

Keyphrases

language model
pre trained
biomedical text mining
text mining
language modeling
training data
n gram
information retrieval
word segmentation
test collection
query expansion
retrieval model
probabilistic model
semi automated
speech recognition
training examples
mixture model
word sense disambiguation
smoothing methods
control signals
query terms
learning algorithm
principal component analysis
neural network