700,000组通用场景图像描述数据(简单描述)

700,000组图像及描述,图片类型涵盖风景、动物、花卉树木、人物、汽车、运动、工业以及建筑等多种类别及一个美学子集,每张图不少于两种描述,每种描述一句话;少部分图像只有一种描述,描述语言为英语,中文两种语言

数据规格

数据规模
70万组图像及描述
图片类型
涵盖风景、动物、花卉树木、人物、汽车、运动、工业以及建筑等多种类别及一个美学子集
数据格式
图片格式为.jpg,文本格式为.txt
描述语言
中文、英文
文本长度
原则上单句为5~20个字,每张图涵盖不少于两种描述,每种描述一句话;少部分图像只有一种描述
主要描述内容
图像中的主要场景或一些显著特征
准确率
正确描述的图像占比不低于95%

样例展示