cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

1226

_AI数据集产品_数据堂

57,645张竖排文字场景OCR数据_57,645张竖排文字场景OCR数据

57,645张竖排文字场景OCR数据

  • 经授权许可的成品数据集助力快速启动AI项目

57,645张竖排文字场景OCR数据。采集场景包括街景、牌匾、广告牌、海报、装饰、艺术字、杂志封面等。语言分布为中文和英文(少量)。在标注方面,列级矩形框(多边形框、平行四边形框)标注、列级内容转写;非竖排矩形框(多边形框、平行四边形框)标注、非竖排内容转写。本套数据可用于多种竖排文字场景OCR任务。

购买咨询 获取样例

数据规格

数据规模
57,645张,528,553个框
采集环境
包括街景、牌匾、广告牌、海报、装饰、艺术字、杂志封面等
采集多样性
多种场景、多种字体
语言分布
中文、英文(少量)
标注框方向分布
324,399个竖排框,204,154个非竖排框
标注框形状分布
34,936个矩形框、220,716个多边形框、272,901个平行四边形框
数据格式
图像数据格式为.jpg,标注文档格式为.json
标注内容
列级矩形框(多边形框、平行四边形框)标注、列级内容转写;非竖排矩形框(多边形框、平行四边形框)标注、非竖排内容转写
准确率
标注框顶点偏差不超过三个像素为正确检测,检测框精度不低于97%;文本转写精度不低于97%

样例展示

  • 57,645张竖排文字场景OCR数据
  • 57,645张竖排文字场景OCR数据
  • 57,645张竖排文字场景OCR数据

已获被采集人明确授权且高质量的成品训练数据集助您快速启动AI项目

立即开始

相关数据推荐

8,604张阿拉伯语自然场景OCR数据
8,604张阿拉伯语自然场景OCR数据
104,320张韩语和印地语自然场景OCR数据
104,320张韩语和印地语自然场景OCR数据
262人5,162张繁体字(中国台湾)手写体OCR数据
262人5,162张繁体字(中国台湾)手写体OCR数据
105,941张12种语言自然场景OCR数据
105,941张12种语言自然场景OCR数据

数据亮点

57,645张竖排文字场景OCR数据

*姓名:

*手机:

*公司名称:

*企业邮箱:

*需求:

57,645张竖排文字场景OCR数据