10万组图标图文描述数据集 | 含3D/矢量风格,16子类中文标注

本数据集提供超过10万组高质量的图标与中文描述配对数据,涵盖3D风格与矢量插图两大类别,细分至16个子类。每个图标均配有约30字左右的精准中文描述,适用于训练图形识别模型、优化UI/UX界面交互理解,以及提升多模态模型的视觉语言对齐能力。

数据规格

数据规模
100,145组,16个子类
图标类型
3D风格图标(3D风格图标、轻拟物风格图标、毛玻璃风格图标)和矢量插图图标(线性图标、面性图标等,共13个子类)
描述语言
中文
数据分辨率
原则上分辨率不低于128*128
数据格式
图像格式为.jpg等图像通用格式,标注文件为.txt格式
文本长度
描述字数在30个字左右
标注内容
对图标进行描述,描述内容主要包括图标名称,图标外观特点和图标的作用
准确率
图像描述文本客观清晰,无明显语句错误,无敏感内容描述,句准确率不低于95%

样例展示