计算机视觉
语音识别
数据集名称 | 产品类型 | 采集内容 | 数据规模 | 用途 |
---|---|---|---|---|
1,000人多人种7种表情识别数据 | 图像 | 每人采集正常、高兴、惊奇、悲伤、愤怒、厌恶、恐惧七种表情 | 1000人 | 表情识别 |
3,000张人脸抠图数据 | 图像 | 人脸、五官、身体和附属物抠图标注 | 3000张 | 人脸分割 |
3,000张人脸106关键点标注数据(复杂场景) | 图像 | 性别、年龄段、人种、戴帽状态、戴眼镜状态、背景状态、人脸朝向、眼睛状态、嘴巴状态9种属性及106关键点 | 3000张 | 人脸关键点定位、人脸行为识别 |
100人驾驶员行为采集数据 | 图像 | 危险驾驶行为、疲劳驾驶行为、视线偏移行为 | 100人 | 驾驶员行为分析 |
100人活体检测数据 | 图像 | 活体动作视频、唇语视频、非活体视频(对抗样本)、唇语视频对抗数据、彩色照片对抗数据 | 100人 | 活体检测 |
50,016条手势识别数据 | 图像 | 18种静态手势及手部21关键点 | 50016条 | 手势识别 |
100人监控场景人脸识别数据 | 图像 | 监控场景下的人脸信息、标注采集人的性别和年龄 | 100人 | 人脸识别 |
1,000人7,156张跨年龄人脸数据 | 图像 | 跨10个年龄段,每人至少采集4张不同年龄段的照片 | 1000人 | 人脸识别 |
1,000人多色人种人脸多姿态数据 | 图像 | 每人29张照片(室内多姿态14张+室外多姿态14张+证件照1张),标注人种、性别、年龄、人脸姿态 | 1000人 | 人脸识别 |
10类200组城市精细化治理数据 | 图像 | 街道、小吃街、店铺门口、楼道、小区门口、建筑场地等18个子类,每组2张不同角度图片 | 200组 | 城市精细化治理 |
3,000张12种语言自然场景OCR数据 | 图像 | 包含亚洲语系、欧洲语系、对内容行级四边形框标注、行级内容转写 | 3000张 | 光学字符识别 |
100人面部遮挡多姿态人脸识别数据 | 图像 | 10种遮挡条件下(包括不遮挡条件)4种光线下5种人脸姿态,共200张人脸数据图像并标注人脸姿态和遮挡物 | 100人 | 人脸识别 |
100人3D活体检测数据 | 图像 | 三种肤色人种的活体图片数据、活体图片对抗数据、面具图片对抗数据,每张照片均对应一张深度图,一个深度信息文件,一个相机内参文件 | 100人 | 人脸识别、活体检测 |
100人电动自行车进电梯数据 | 图像 | 每位被采集者分别采集1张照片,4段视频,标注采集人的性别、人种和年龄。对视频标注采集场景和电动自行车款式 | 100人 | 城市精细化治理 |
1,435张发丝级人体抠图数据(精细版) | 图像 | 采集半身或全身人体照,对采集的人体照进行发丝级抠图,标注被采集者的人种、性别、年龄、采集场景 | 1435张 | 实例分割 |
200人监控场景下步态识别数据 | 图像 | 按照规定路线分别以快速、正常、慢速走路姿势进行采集,着春秋、夏、冬季服饰共走九个来回 | 200人 | 步态识别 |
200 人真实监控场景下Re-ID数据 | 图像 | 采集8种人体朝向,标注人体矩形框和15种人体属性 | 200人 | Re-ID |
200人监控场景下Re-ID数据 | 图像 | 人体矩形框、15种人体属性信息,标注被采集人的性别、年龄、人种、采集场景、服饰类别、摄像头编号、摄像头高度 | 200人 | Re-ID |
200黄种人多姿态人脸图像与视频数据 | 图像 | 人脸姿态、人头姿态、国籍、性别、采集环境和年龄 | 200人 | 人脸识别 |
数据集名称 | 产品类型 | 采集设备 | 数据规模 | 用途 |
---|---|---|---|---|
1505小时普通话手机采集语音数据 | 语音 | 手机 | 1505小时、6278名发音人 | 语音识别、声纹识别、机器翻译 |
300小时普通话自然对话手机采集语音数据 | 语音 | 手机 | 300小时、440发音人 | 语音识别、声纹识别、机器翻译 |
200小时中国儿童手机采集语音数据 | 语音 | 手机 | 200小时、557名发音人 | 语音识别、声纹识别 |
200小时中英混读手机采集语音数据 | 语音 | 手机 | 200小时、701名发音人 | 语音识别、声纹识别 |
300小时十门方言手机采集语音数据 | 语音 | 手机 | 300小时 | 语音识别、方言识别 |
200小时十国人说英语手机采集语音数据 | 语音 | 手机 | 200小时、528名发音人 | 语音识别、语种识别 |
50人远场家居采集语音数据 | 语音 | 麦克风阵列 | 50名发音人 | 语音增强、语音识别 |
200小时十门外语手机采集语音数据 | 语音 | 手机 | 200小时 | 声学研究、语言模型训练、算法研究 |
注:请按申请机构研究方向合理申请数据。计算机视觉助研数据集申请上限为6套。
注:请按申请机构研究方向合理申请数据。语音识别助研数据集申请上限为4套。
申领流程及说明
协议原件邮寄信息
收 件 人:市场中心
联系方式:13260137510
邮件地址:services@datatang.com
收件地址:北京市海淀区宝盛南路1号院11号楼