-
20,000小时中文普通话语音数据集
数据堂自有版权的中文普通话语音数据集全部由来自中国本土发音人进行录制。覆盖不同年龄段,如低幼儿童、青少年、成年人、老年人等;覆盖不同地域发音人的不同习惯,如重口音普通话、台湾普通话、中英混读语音数据等;同时,中文普通话也覆盖室内室外不同场景,如家居、车载等场景的唤醒词、命令词等普通话语音数据。
更多数据
- 245小时车载环境普通话手机采集语音数据
- 1,505小时普通话手机采集语音数据
- 1,420小时普通话自然语音手机采集数据
- 849小时普通话交互类手机采集语音数据
- 1,351小时普通话自然对话语音数据(手机+录音笔)
- 521人普通话声纹识别手机采集语音数据
-
10,000小时中国地区方言语音数据集
数据堂自有版权的中国地区方言语音数据集涵盖了来自八大方言区本土发音人参与录制的语音数据,包括粤语语音数据集、上海话语音数据集、闽南话语音数据集、昆明方言语音数据集、武汉方言语音数据集、长沙方言语音数据集、四川方言语音数据集等多个地区的方言语音数据,同时由本地人参与质检校对,文本转写更精确。
更多数据
- 176小时苏州方言手机语音采集语音数据
- 249小时杭州方言手机采集语音数据
- 110小时河南方言手机采集语音数据
- 67小时东北方言手机采集语音数据
- 1,000小时武汉方言手机采集语音数据
- 1,002小时长沙方言手机采集语音数据
-
10,000小时各国人说英语语音数据集
数据堂自有版权的各国人说英语语音数据集包含了美国、英国、中国、德国、法国、加拿大等各国人说英语的语音数据集。录音文本由语言专家参与设计,贴合客户应用场景,涵盖通用、交互、车载、家居等多类别,内容丰富且文本经过人工校对,准确率高。
更多数据
- 593小时中国人说英语手机采集语音数据
- 535小时德国人说英语手机采集语音数据
- 520小时法国人说英语手机采集语音数据
- 388小时西班牙人说英语手机采集语音数据
- 203小时中国儿童说英语手机采集语音数据
- 227小时意大利人说英语手机采集语音数据
-
6,000小时亚洲语系语音数据集
数据堂自有版权的亚洲语系语音数据集包含了来自印尼、日本、韩国、越南、马来、泰国等国家的本土发言人参加录制。录音内容丰富,所有文本均有专业人员人工转写,准确率高。
更多数据
- 292小时泰语手机采集数据_朗读
- 490人泰语手机采集语音数据_引导
- 360小时印尼语手机采集语音数据_朗读
- 496人印尼语手机采集语音数据_引导
- 156人马来西亚语手机采集数据_朗读
- 240小时印地语手机采集语音数据_朗读
-
10,000小时欧洲语系语音数据集
数据堂自有版权的欧洲语系语音数据集包含了来自德国、法国、俄罗斯、西班牙、意大利等国家本土发音人参与录制。录音内容丰富,所有文本均有专业人员人工转写,准确率高。
更多数据
- 232小时法语手机采集语音数据_朗读
- 405人法语手机采集语音数据_引导
- 227小时西班牙语手机采集语音数据_朗读
- 343人西班牙语手机采集语音数据_引导
- 338小时西班牙语手机采集语音数据
- 435小时西班牙语手机采集语音数据
-
2,500小时其他语系语音数据集
数据堂自有版权的其他语系语音数据集主要包括巴西人录制的巴西葡萄牙语数据集、以色列人录制的希伯来语数据集。该系列仍在不断扩建中。
更多数据
- 1,044小时巴西葡萄牙语手机采集语音数据