262人5,162张繁体字(中国台湾)手写体OCR数据

262人5,162张繁体字(中国台湾)手写体OCR数据,标注行级文本的四边形框,行级文本转写。本套数据可用于繁体字OCR任务。

数据规格

数据规模
262人,5,162张
采集环境
包括A4纸、方格纸、横格纸等
采集设备
手机
拍摄角度
平视
数据格式
图像格式为.jpg,标注文档格式为.json
数据内容
涵盖小说、诗歌、新闻领域
标注内容
行级四边形标注、行级内容转写
准确率
四边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于97%;文本转写精度不低于97%

样例展示