• 🥇 版权: 本文由【墨理学AI】原创、在CSDN首发、各位大佬、敬请查阅
  • 🎉 声明: 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
  • ❤️ 如果文章对你有帮助、欢迎一键三连

本文属早期博文


近期整理博文 – 免费的汉语说话人识别语料库


  • 清华大学提供的30个小时的中文语料库

清华大学提供的30个小时的中文语料库

  • 数据集下载链接记录

各领域公开数据集下载

http://deeplearning.net/datasets

  • 论文下载的网址

https://arxiv.org/

  • 语音方向论文下载

Interspeech 2018

  • 语音分离的相关数据集:

Logiciels / Corpus

  • Mozilla迄今为止最大的公开语音数据集Common Voice——重点

Mozilla最大的公开语音数据集Common Voice

  • 其他语音数据集推荐

Mozilla还为大家提供了其他的语音数据集,有需要的同学请自取。

有声读物英文语料库LibriSpeech:
https://www.openslr.org/12

TED演讲语料库TED-LIUM:
https://www.openslr.org/51/

讲话转录文本语料库VoxForge:
http://www.repository.voxforge1.org/downloads/SpeechCorpus/Trunk/

翻译和口语音频的大型数据库Tatoeba:
https://tatoeba.org/eng/downloads


博主最强总结导航如下


9-6

更多推荐