338小时西班牙语语音数据_朗读(手机)

西班牙语语音数据_朗读(手机),基于给定的脚本朗读并模拟录制,涵盖新闻、评论、百科、经济、科学、法律等领域,内容丰富。此数据集标注了文本内容,噪音等多种属性,由800名西班牙、墨西哥、阿根廷等国的西班牙语母语人员参与录制,准确性高,为语音识别相关研究及应用提供了丰富的资源,经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。

数据规格

格式
16kHz,16bit,未压缩wav,单声道;
内容分类
新闻、评论、百科、经济、科学、法律等;
录音条件
相对安静的室内,无回声;
录音设备
安卓手机:苹果手机=1.2:1;
录音人信息
共800人,来自西班牙、墨西哥、智利、阿根廷等国家,其中男性占比49%,女性占比51%;
国家
墨西哥,西班牙,智利,阿根廷等;
语言
西班牙语;
标注特点
标注文本内容,3种噪音符号,标识符;
准确率
句准确率95%(噪音符号和其他标识符的准确率不计入在内)

样例展示

0:00/ 0:00

Esperamos poder contar con su asistencia en nuestro próximo evento

0:00/ 0:00

Trece en la primitiva iglesia mudéjar de S

0:00/ 0:00

No nos hemos marcado ningún objetivo

0:00/ 0:00

La capital Baku resultó muy dañada

0:00/ 0:00

Por este motivo el R