11,000组人体行为图像&视频描述数据
11,000组人体行为图像&视频描述数据,包含10,000张图像,10,00段视频采集了不同季节,不同拍摄角度的多种人体行为,包含室内场景与室外场景。描述语言为英语,主要描述了人物性别、年龄、衣着、行为描述与肢体动作。
数据规格
数据规模
21,960张图像,1,000段视频
人种分布
白种人、黑色人种、黄种人
性别分布
男、女
年龄分布
从少年到老年,中青年为主
采集环境
包括室内场景和室外场景
采集多样性
不同年龄段、不同采集环境、不同季节,多种拍摄角度,多种人体行为
数据格式
图片格式为.jpg,视频格式为.mp4,文本格式为.txt
描述语言
英语、中文
文本长度
原则上为30~60个单词,通常包含3-5句话
主要描述内容
性别、年龄、衣着、行为描述、肢体动作
准确率
正确标注的图像占比不低于97%
样例展示


