cn
数据解决方案
请输入姓名
手机号码格式错误
请输入联系电话
请输入公司名称
请输入正确的工作邮箱
请输入数据需求
提交成功!感谢您支持数据堂。
填写格式错误请重新填写
确定
数据需求不能小于5个字且不能为纯数字
活动时间:即日起——2020年3月31日
自“新冠肺炎”疫情爆发至今,牵动着无数国民的心,抗击疫情,人工智能的发展也起到举足轻重的作用——同程排查、对接物资供需、红外热像体温监测等。疫情期间,为了更好的助力研发需求,服务疫区同胞,数据堂面向企业客户及科研机构限时免费开放【200小时武汉方言语音数据】。
数据有效时长200小时,数据采集自武汉地区本土发音人;男女比例均匀;年龄分布青年为主,覆盖多个年龄段;录音内容为通用口语、交互、家居命令、方言用语、数字;文本转写,句准确率95% 可应用于语音识别、机器翻译、声纹识别领域。
录音人员 | 男女比例均衡;年龄以青年为主,覆盖多个年龄段;录音人均为武汉当地人 |
录音环境 | 相对安静的室内,无回声 |
录音内容 | 通用口语;交互;家居命令;方言用语;数字 |
录音设备 | 手机录制,安卓:IOS=3:1 |
标注特点 | 文本转写;噪音符号;特殊标识符 |
格式 | 16kHz,16bit,wav,单声道 |
准确率 | 95%以上 |
注:该数据精选自【1000小时武汉方言语音数据】
注:本次活动限企业及科研机构申请,活动最终解释权归数据堂所有。
方言区 | 覆盖地域 | 时长 | 数据 |
西南官话 |
武汉 四川省 昆明 |
1000小时 794小时 1000小时 |
武汉方言手机采集语音数据 四川方言手机采集语音数据 昆明方言手机采集语音数据 |
粤语 | 粤语地区 | 1652小时 | 粤语手机采集语音数据 |
吴语 |
上海 苏州 杭州 |
1032小时 177小时 249小时 |
上海方言手机采集语音数据 苏州方言手机语音采集数据 杭州方言手机语音采集数据 |
闽语 | 闽南语地区 | 1044小时 | 闽南语手机采集语音数据 |
湘语 | 长沙 | 1000小时 | 长沙方言手机采集语音数据 |
东北官话 | 东北 | 68小时 | 东北方言手机采集语音数据 |
中原官话 | 河南 | 110小时 | 河南方言手机采集语音数据 |
注:另有全国各地重口音普通话语音数据1800小时