A Comparative Study on Transformer vs RNN in Speech Applications.

Shigeki Karita Nanxin Chen Tomoki Hayashi Takaaki Hori Hirofumi Inaguma Ziyan Jiang Masao Someki Nelson Enrique Yalta Soplin Ryuichi Yamamoto Xiaofei Wang Shinji Watanabe Takenori Yoshimura Wangyou Zhang

Published in: CoRR (2019)

Keyphrases

recurrent neural networks
speech recognition
nearest neighbor
fault diagnosis
fuzzy logic
speech signal
spoken language
power system
comparative study
audio visual
automatic speech recognition
speech synthesis
vocal tract
power transformers
recognition engine
distribution network
endpoint detection
neural network
audio stream
text to speech synthesis
hearing impaired
speech processing
speaker verification
speaker identification
emotion recognition
pattern recognition