【1,505小时 中文普通话语音数据集】数据时长1505小时,是数据堂中文普通话语音数据库中的一部分。采集区域覆盖全国34个省级行政区域,参与录音人数达6408人,录音内容超30万条口语化句子。经过专业语音校对人员转写标注,并通过严格质量检验,句标注准确率达98%以上,是行业内句准确率的最高标准。(仅支持学术研究,未经允许禁止商用)
格式 | 16kHz 16bit,wav,单声道 | ||||||||||||||||||||||||||||||
录音环境 | 安静的室内,噪音不影响语音识别 | ||||||||||||||||||||||||||||||
录音内容 | 30万条口语化句子 | ||||||||||||||||||||||||||||||
录音人员 |
6,408 人 男性 2,999 人,女性 3,301 人 ≤20 岁 1,481 人,21~30 岁 4,412 人,31~40 岁 244 人,40 岁以上 163 人 录音人员分布于广东、福建、山东、江苏、北京、湖南、江西、香港、澳门等 34个省级行政区域 |
||||||||||||||||||||||||||||||
设备 | 安卓:iOS=9:1 | ||||||||||||||||||||||||||||||
语音 | 普通话;有口音的普通话 | ||||||||||||||||||||||||||||||
应用场景 | 语音识别 机器翻译 声纹识别 |
||||||||||||||||||||||||||||||
准确率 | 句标注准确率不低于98% | ||||||||||||||||||||||||||||||
使用效果 |
基于aidatatang_200zh数据集的语音识别模型训练效果,测评结果:
基于aidatatang_1,505zh数据集的语音识别模型训练效果,测评结果:
|
||||||||||||||||||||||||||||||
训练方法 |
基于aidatatang_200zh数据集的训练方法点击查看 (说明:aidatatang_200zh数据集是aidatatang_1,505zh数据集中的一部分) |
更多数据产品推荐
数据堂专注AI数据生产,为您提供更多高质量商用数据集
10万人人脸多姿态网爬数据,每个人至少20张图像,涵盖多种姿态、多种拍摄角度、多种光照条件,数据可用于人脸识别等任务。
20,000人人证比对数据,每个人一张证件照和5-10张生活照,涵盖多种背景多种光照,数据可用于人证比对等任务。
5,000东南亚人(印尼人、马来人、越南人、菲律宾人、泰国人、新加坡人等)一人多照数据,每个人至少29张图像,涵盖多种姿态、多种拍摄角度、多种光照条件,数据可用于人脸识别等任务。
5,000墨西哥人一人多照数据,每个人至少29张图像,涵盖多种姿态、多种拍摄角度、多种光照条件,数据可用于人脸识别等任务。
咨询电话
400-650-6137
服务邮箱
services@datatang.com
Terms Privacy Datatang. All Rights Reserved. Legal statement and privacy policy
提交成功!感谢您支持数据堂。
确定提交成功!下载《数据使用许可协议-数据堂-中文普通话语音数据》
确定并下载