이름 | 크기(길이/화자수) | 용도 | 링크 | SF (kHz) | 비고 |
LJSpeech | 24h, 1 Eng Female | TTS | 22.05 | ||
LibriSpeech | 1000h, 25min/spk, 2000 spks, Eng | ASR | 공식 / 구글 | 24 | duration에 따라 subset이 나뉘어져 있음 |
LibriTTS | 585h, 2456 spk, Eng | TTS | 공식 / 구글 | 24 | |
VCTK | 400 utt, 110 spks, Eng | ASR | 공식 / 구글 | 48 | accented |
Artic | 1150 utt, 10 spks, Eng | TTS | festvox | 16 | accented |
- TF 제공 DB 카탈로그: https://www.tensorflow.org/datasets/catalog/overview
- OpenSLR: http://www.openslr.org/