155人马来西亚马来语语音数据_引导(手机)
马来西亚马来语语音数据_引导(手机),基于给定的脚本朗读并模拟录制,涵盖车载、家居、语音助手等多个领域,内容丰富。此数据集标注了文本内容等多种属性,由155位马来西亚本地人员参与采集,准确性高,为语音识别相关研究及应用提供了丰富的资源,经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。
数据规格
格式
16kHz,16bit,未压缩wav,单声道;
内容分类
车载场景,智能家居,语音助手;
录音条件
相对安静的室内,无回声;
录音设备
安卓手机,苹果手机;
录音人信息
155名马来人,其中男性占比34%,女性占比66%;
国家
马来西亚;
语言地区代码
ms-MY;
语言
马来语;
标注特点
标注文本内容,4种标识符;
准确率
句准确率95%(标识符的准确率不计入在内)
样例展示
0:00/ 0:00
Semak nombor telefon.
0:00/ 0:00
Sila bacakan komik Kembara Kembar Nakal keluaran terkini.
0:00/ 0:00
Menggunakan [/Baidu ditu/] untuk mengetahui [~]R [/and/] [~]R yang seterusnya.
0:00/ 0:00
Berapa lama untuk sampai ke [~]R [/and/] [~]R seterusnya?
0:00/ 0:00
Sila mainkan novel yang bertemakan cinta.