
5万组图像编辑数据

10万组图标图文描述数据

690万道中文多学科试题文本结构化解析处理数据

100万道中文代码试题文本结构化解析处理数据

161小时古吉拉特语朗读语音数据

3200万道理工科试题文本结构化解析处理数据

14万道竞赛试题文本结构化解析处理数据

1500小时加拿大法语口语化语音数据

5,000张土耳其语自然场景OCR数据

900小时泰语口语化语音数据

52对双胞胎人脸采集数据

2000小时澳大利亚英语口语化语音数据

150万道韩语试题结构化解析处理数据

534小时台湾口音普通话自然对话手机采集语音数据

3,100万条东南亚语种新闻文本数据

335,000组东南亚语种多轮对话文本数据

1528小时古吉拉特口语化语音数据

302小时他加禄语手机采集朗读语音数据

1620小时古吉拉特语手机采集朗读语音数据

300小时马来语手机采集朗读语音数据
. . .