Dodging the Data Bottleneck: Automatic Subtitling with Automatically Segmented ST Corpora.

Sara Papi Alina Karakanta Matteo Negri Marco Turchi

Published in: AACL/IJCNLP (2) (2022)

Keyphrases

data sets
data analysis
training data
raw data
data collection
knowledge discovery
databases
data quality
high quality
database
data processing
computer systems
computer vision
synthetic data
data points
automatically segmented
network structure
statistical analysis
data sources
xml documents
pattern recognition
database systems
data mining