3亿组高质量图像描述数据

3亿张图像,每张图像对应一条描述。均为摄影师发布的正版图像作品。绝大部分为英文描述,极少部分为中文描述。

数据规格

数据规模
3亿张图像,每张图像对应一条描述。全量图库(包含摄影图+矢量图等)总计近3亿张,可用于生成式AI训练的全量图库(去除掉编辑新闻图后的摄影图+矢量图)总计1亿张左右
3亿张图像,每张图像对应一条描述。全量图库(包含摄影图+矢量图等)总计近3亿张,可用于生成式AI训练的全量图库(去除掉编辑新闻图后的摄影图+矢量图)总计1亿张左右
数据格式
图像数据格式包括.jpg、.png、.svg,描述文档格式为.txt
数据内容
作者发布的正版图像作品及其撰写的描述
图像类型
摄影图和矢量图,覆盖多种场景类别
图像分辨率
4K及以上
描述语言
绝大部分为英文描述,极少部分为中文描述