110小时中国河南方言语音数据_朗读(手机)

中国河南方言语音数据_朗读(手机),基于给定的脚本朗读并模拟录制,覆盖日常短信及多领域客户咨询。此数据集标注了文本内容等多种属性,由463名来自不同地域和文化背景的河南人参与录制,口音正宗,文本经过人工校对,准确率高,为语音识别相关研究及应用提供了丰富的资源,经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。

数据规格

格式
16kHz,16bit,未压缩wav,单声道
内容分类
通用类;交互类
录音条件
安静的室内,无回声
录音设备
安卓手机
录音人信息
共计463名河南人;男性占比42%,女性占比58%;21-30岁录音人占总人数的85%
国家
中国
语言
河南方言
标注特点
标注文本内容
准确率
句准确率95%

样例展示

0:00/ 0:00

没带钥匙就把门锁上了

0:00/ 0:00

大衣哥儿。我要死掉了。我想听只要有你

0:00/ 0:00

我的故乡在远方,作者张抗抗

0:00/ 0:00

刘蓓 邬君梅等饰演的五个妈妈性格迥异

0:00/ 0:00

我说累是真累呀。怀孕多少天能查出来呀