cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

1254

_AI数据集产品_数据堂

104,320张韩语和印地语自然场景OCR数据_104,320张韩语和印地语自然场景OCR数据

104,320张韩语和印地语自然场景OCR数据

  • 经授权许可的成品数据集助力快速启动AI项目

104,320张韩语和印地语自然场景OCR数据采集场景包括商品包装、海报、车票、提示语、菜单、建筑物标志等。数据多样性包括多种场景、多种拍摄角度、多种光照条件。语言分布为韩语、印地语和英文(少量)。在标注方面,对数据进行行级多边形框(或四边形框、矩形框)标注、行级内容转写、文本属性(语言种类);列级多边形框(或四边形框、矩形框)标注、列级内容转写、文本属性(语言种类)。本套韩语和印地语自然场景OCR数据可用韩语和印地语自然场景下的OCR任务。

购买咨询 获取样例

数据规格

数据规模
韩语76,861张,555,913个框;印地语27,459张,200,453个框
采集环境
包括商品包装、海报、车票、提示语、菜单、建筑物标志等
采集多样性
多种自然场景、多种拍摄角度、不同光照条件
采集设备
手机
拍摄角度
仰视、俯视、平视
语言分布
韩语、印地语、英语(少量)
数据格式
图像格式为.jpg,标注文档格式为.json
标注框形状分布
韩语315,822个四边形框、240,091个多边形框;印地语780个四边形框、199,671个多边形框、2个矩形框
标注内容
行级多边形框 (或四边形框、矩形框)标注、行级内容转写、文本属性(语言种类);列级多边形框 (或四边形框、矩形框)标注、列级内容转写、文本属性(语言种类)
准确率
标注框顶点偏差不超过五个像素为正确检测,检测框精度不低于95%;文本转写精度不低于95%

样例展示

  • 104,320张韩语和印地语自然场景OCR数据
  • 104,320张韩语和印地语自然场景OCR数据
  • 104,320张韩语和印地语自然场景OCR数据

已获被采集人明确授权且高质量的成品训练数据集助您快速启动AI项目

立即开始

相关数据推荐

8,604张阿拉伯语自然场景OCR数据
8,604张阿拉伯语自然场景OCR数据
57,645张竖排文字场景OCR数据
57,645张竖排文字场景OCR数据
262人5,162张繁体字(中国台湾)手写体OCR数据
262人5,162张繁体字(中国台湾)手写体OCR数据
105,941张12种语言自然场景OCR数据
105,941张12种语言自然场景OCR数据

数据亮点

104,320张韩语和印地语自然场景OCR数据

*姓名:

*手机:

*公司名称:

*企业邮箱:

*需求:

104,320张韩语和印地语自然场景OCR数据