Umut Isik

Publication Activity (10 Years)

Years Active: 2019-2024
Publications (10 Years): 28

Top Topics

Wavelet Decomposition

Speech Enhancement

Top Venues

Publications

Masahito Togami, Jean-Marc Valin, Karim Helwani, Ritwik Giri, Umut Isik, Michael M. Goodwin
Real-Time Stereo Speech Enhancement with Spatial-Cue Preservation Based on Dual-Path Structure. ICASSP (2024)
Siyuan Yuan, Zhepei Wang, Umut Isik, Ritwik Giri, Jean-Marc Valin, Michael M. Goodwin, Arvindh Krishnaswamy
Improved Singing Voice Separation with Chromagram-Based Pitch-Aware Remixing. ICASSP (2022)
Jean-Marc Valin, Ritwik Giri, Shrikant Venkataramani, Umut Isik, Arvindh Krishnaswamy
To Dereverb Or Not to Dereverb? Perceptual Studies On Real-Time Dereverberation Targets. CoRR (2022)
Zhepei Wang, Ritwik Giri, Shrikant Venkataramani, Umut Isik, Jean-Marc Valin, Paris Smaragdis, Michael M. Goodwin, Arvindh Krishnaswamy
Semi-supervised Time Domain Target Speaker Extraction with Attention. CoRR (2022)
Krishna Subramani, Jean-Marc Valin, Umut Isik, Paris Smaragdis, Arvindh Krishnaswamy
End-to-end LPCNet: A Neural Vocoder With Fully-Differentiable LPC Estimation. INTERSPEECH (2022)
Jean-Marc Valin, Umut Isik, Paris Smaragdis, Arvindh Krishnaswamy
Neural Speech Synthesis on a Shoestring: Improving the Efficiency of LPCNet. CoRR (2022)
Jean-Marc Valin, Umut Isik, Paris Smaragdis, Arvindh Krishnaswamy
Neural Speech Synthesis on a Shoestring: Improving the Efficiency of Lpcnet. ICASSP (2022)
Siyuan Yuan, Zhepei Wang, Umut Isik, Ritwik Giri, Jean-Marc Valin, Michael M. Goodwin, Arvindh Krishnaswamy
Improved singing voice separation with chromagram-based pitch-aware remixing. CoRR (2022)
Krishna Subramani, Jean-Marc Valin, Umut Isik, Paris Smaragdis, Arvindh Krishnaswamy
End-to-end LPCNet: A Neural Vocoder With Fully-Differentiable LPC Estimation. CoRR (2022)
Jonah Casebeer, Vinjai Vale, Umut Isik, Jean-Marc Valin, Ritwik Giri, Arvindh Krishnaswamy
Enhancing into the Codec: Noise Robust Speech Coding with Vector-Quantized Autoencoders. ICASSP (2021)
Jonah Casebeer, Vinjai Vale, Umut Isik, Jean-Marc Valin, Ritwik Giri, Arvindh Krishnaswamy
Enhancing into the codec: Noise Robust Speech Coding with Vector-Quantized Autoencoders. CoRR (2021)
Jean-Marc Valin, Srikanth V. Tenneti, Karim Helwani, Umut Isik, Arvindh Krishnaswamy
Low-Complexity, Real-Time Joint Neural Echo Control and Speech Enhancement Based On Percepnet. ICASSP (2021)
Zhepei Wang, Ritwik Giri, Umut Isik, Jean-Marc Valin, Arvindh Krishnaswamy
Semi-Supervised Singing Voice Separation With Noisy Self-Training. ICASSP (2021)
Ritwik Giri, Shrikant Venkataramani, Jean-Marc Valin, Umut Isik, Arvindh Krishnaswamy
Personalized PercepNet: Real-Time, Low-Complexity Target Voice Separation and Enhancement. Interspeech (2021)
Jean-Marc Valin, Umut Isik, Neerad Phansalkar, Ritwik Giri, Karim Helwani, Arvindh Krishnaswamy
A Perceptually-Motivated Approach for Low-Complexity, Real-Time Enhancement of Fullband Speech. INTERSPEECH (2020)
Jonah Casebeer, Umut Isik, Shrikant Venkataramani, Arvindh Krishnaswamy
Efficient Trainable Front-Ends for Neural Speech Enhancement. CoRR (2020)
Bahareh Tolooshams, Ritwik Giri, Andrew H. Song, Umut Isik, Arvindh Krishnaswamy
Channel-Attention Dense U-Net for Multichannel Speech Enhancement. CoRR (2020)
Umut Isik, Ritwik Giri, Neerad Phansalkar, Jean-Marc Valin, Karim Helwani, Arvindh Krishnaswamy
PoCoNet: Better Speech Enhancement with Frequency-Positional Embeddings, Semi-Supervised Conversational Data, and Biased Loss. CoRR (2020)
Wayne Chi, Prachi Kumar, Suri Yaddanapudi, Rahul Suresh, Umut Isik
Generating Music with a Self-Correcting Non-Chronological Autoregressive Model. CoRR (2020)
Jonah Casebeer, Umut Isik, Shrikant Venkataramani, Arvindh Krishnaswamy
Efficient Trainable Front-Ends for Neural Speech Enhancement. ICASSP (2020)
Ritwik Giri, Fangzhou Cheng, Karim Helwani, Srikanth V. Tenneti, Umut Isik, Arvindh Krishnaswamy
Group Masked Autoencoder Based Density Estimator for Audio Anomaly Detection. DCASE (2020)
Marcello Federico, Robert Enyedi, Roberto Barra-Chicote, Ritwik Giri, Umut Isik, Arvindh Krishnaswamy, Hassan Sawaf
From Speech-to-Speech Translation to Automatic Dubbing. IWSLT (2020)
Ritwik Giri, Srikanth V. Tenneti, Fangzhou Cheng, Karim Helwani, Umut Isik, Arvindh Krishnaswamy
Self-Supervised Classification for Detecting Anomalous Sounds. DCASE (2020)
Bahareh Tolooshams, Ritwik Giri, Andrew H. Song, Umut Isik, Arvindh Krishnaswamy
Channel-Attention Dense U-Net for Multichannel Speech Enhancement. ICASSP (2020)
Umut Isik, Ritwik Giri, Neerad Phansalkar, Jean-Marc Valin, Karim Helwani, Arvindh Krishnaswamy
PoCoNet: Better Speech Enhancement with Frequency-Positional Embeddings, Semi-Supervised Conversational Data, and Biased Loss. INTERSPEECH (2020)
Marcello Federico, Robert Enyedi, Roberto Barra-Chicote, Ritwik Giri, Umut Isik, Arvindh Krishnaswamy
From Speech-to-Speech Translation to Automatic Dubbing. CoRR (2020)
Wayne Chi, Prachi Kumar, Suri Yaddanapudi, Rahul Suresh, Umut Isik
Generating Music with a Self-Correcting Non-Chronological Autoregressive Model. ISMIR (2020)
Ritwik Giri, Umut Isik, Arvindh Krishnaswamy
Attention Wave-U-Net for Speech Enhancement. WASPAA (2019)