docs/datasets/vertical_and_multilingual_datasets.md
这里整理了常用垂类和多语言OCR数据集,持续更新中,欢迎各位小伙伴贡献数据集~
数据来源:CCPD
数据简介: 包含超过25万张中国城市车牌图片及车牌检测、识别信息的标注。包含以下几种不同场景中的车牌图片信息。
CCPD-Base: 通用车牌图片
CCPD-DB: 车牌区域亮度较亮、较暗或者不均匀
CCPD-FN: 车牌离摄像头拍摄位置相对更远或者更近
CCPD-Rotate: 车牌包含旋转(水平20~50度,竖直-10~10度)
CCPD-Tilt: 车牌包含旋转(水平15~45度,竖直15~45度)
CCPD-Blur: 车牌包含由于摄像机镜头抖动导致的模糊情况
CCPD-Weather: 车牌在雨天、雪天或者雾天拍摄得到
CCPD-Challenge: 至今在车牌检测识别任务中最有挑战性的一些图片
CCPD-NP: 没有安装车牌的新车图片。
下载地址
数据来源: source
数据简介: 训练数据共提供了三类数据
1.招行样卡数据: 包括卡面图片数据及标注数据,总共618张图片
2.单字符数据: 包括图片及标注数据,总共37张图片。
3.仅包含其他银行卡面,不具有更细致的信息,总共50张图片。
demo图片展示如下,标注信息存储在excel表格中,下面的demo图片标注为
下载地址: cmb2017-2.zip
数据来源: captcha
数据简介: 这是一个数据合成的工具包,可以根据输入的文本,输出验证码图片,使用该工具包生成几张demo图片如下:
下载地址: 该数据集是生成得到,无下载地址。