cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

177

_AI数据集产品_数据堂

200人中文唤醒词手机采集语音数据_朗读_200人中文唤醒词手机采集语音数据_朗读

200人中文唤醒词手机采集语音数据_朗读

  • 经授权许可的成品数据集助力快速启动AI项目

中文唤醒词语音数据_朗读(手机),基于给定的脚本朗读并模拟录制,涵盖多个唤醒词,内容丰富。此数据集标注了文本内容等多种属性,采集自200名中国本地人,每人180句;录制人员男女比例均匀;采集环境多样,覆盖七大方言区。文本经过人工校对,准确率高,为语音识别相关研究及应用提供了丰富的资源,经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。

购买咨询 获取样例

数据规格

格式
16kHz, 16bit,未压缩wav,单声道
内容分类
唤醒词,包括你好小E、我的荣耀、蒙娜丽莎、成吉思汗、天下无敌
录音条件
安静环境;噪音环境;
录音设备
荣耀honor8,华为G9
录音人信息
共计200名中国人,其中男性占比47%,女性占比53%
国家
中国
语言地区代码
zh-CN
语言
中文普通话
标注特点
标注文本内容
准确率
句准确率99%

样例展示

  • T0253G0001S0122.wav 成吉思汗

  • T0253G0004S0148.wav 天下无敌

  • T0253G0149S0152.wav 天下无敌

  • T0253G0149S0168.wav 天下无敌

  • T0253G0001S0169.wav 天下无敌

已获被采集人明确授权且高质量的成品训练数据集助您快速启动AI项目

立即开始

相关数据推荐

19小时公交场景噪音数据(录音笔)
19小时公交场景噪音数据(录音笔)
190小时法语游戏领域语音数据_口语化
190小时法语游戏领域语音数据_口语化
217小时西班牙语金融领域实体标注语音数据_口语化
217小时西班牙语金融领域实体标注语音数据_口语化
200小时巴西葡萄牙语金融领域实体标注语音数据_口语化
200小时巴西葡萄牙语金融领域实体标注语音数据_口语化

数据亮点

200人中文唤醒词手机采集语音数据_朗读

*姓名:

*手机:

*公司名称:

*企业邮箱:

*需求:

200人中文唤醒词手机采集语音数据_朗读