8,604张阿拉伯语自然场景OCR数据
8,604张阿拉伯语自然场景OCR数据包括多种自然场景、多种拍摄角度。在标注方面,标注行级文本的四边形框和转写,多边形框标注和转写。本套数据可用于阿拉伯语言OCR任务。
数据规格
数据规模
8,604张,65,231个阿语四边形框,909个阿语多边形框
采集环境
包括商店牌匾、站牌、海报、车票、路标、漫画、井盖画、提示语、警示语、包装说明、菜单、建筑物标志、杂志或书本封面等
采集多样性
包括多种自然场景、多种拍摄角度
采集设备
手机、相机
拍摄角度
仰视、俯视、平视
数据格式
图像格式为.jpg,标注文档格式为.json
标注内容
行级四边形标注、行级内容转写;多边形框标注和转写
准确率
四边形框或多边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于95%;文本转写精度不低于95%。
样例展示



