ddddocr: 对图片处理提升识别率

news/2025/11/22 22:29:16/文章来源:https://www.cnblogs.com/architectforest/p/19258409

一,识别有误

dataurl:

data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAPAAAABQCAMAAAAQlwhOAAAA81BMVEUAAAB/TiCdbD6GVSdoNwnPnnB7ShyDUiTDkmR5SBrVpHbMm22FVCa5iFrUo3WUYzW9jF5yQRPDkmS/jmCFVCZyQRNnNghvPhCVZDZfLgCbajy8i116SRundkjXpni7ilx2RRdlNAbRoHJuPQ/OnW+5iFrbqnyvflCFVCaIVynWpXfFlGaCUSOPXjB2RRdkMwV8Sx3JmGqcaz2kc0XWpXeMWy3ZqHrOnW+xgFJxQBJsOw1qOQuHViiATyG4h1m8i12ndkiUYzV2RRe7ilyHViiMWy2EUyWSYTPQn3GUYzXIl2lpOAraqXuNXC51RBbQn3F8Sx3mH0b2AAAAAXRSTlMAQObYZgAABnpJREFUeJzkm+lOIzkQx11CZEbiEEggAmHEh1E4IsQlQFGiwHAI5kMP7/84K9Lddl0++grH1q5GuGOX6+e/XbY7YD6JXX90AAu26+tvQnyRWjGZd612LIuwiwsf8WZNj2trn5zY83xzszYxLtzXdPIBFuQ9T3Ryf8+JR/Uj+kA7P08mZuXR6IsS125Zjfdrjk59+6rzob45XjAQqLe1kGiwhaLRbVbJO8zNh721pRP/qBxVWjDzcCo2m83SiaEEzvt5lTU8vD/CxFXGvIjEjn27Ct/QPoiZ11eFWLcIb+KYj8o4cCSpISTZzY0jBjSZ/QrXs0Te0QjksLdrTGFTdKD25V3YrdmIw9qAujDMqAEDHJdRdBkBTpodKOw6o97l4II5Pj6ulzYj3boC2yE6nFJivXCs+cfHoQ2L2TTep8sVKAYD3hhaNDlVFf5yTWlh/OIPptPI7U1ZpcD17jBjqILK+NS677y/BLG8vbEOkcKeRNmpwnwwRd9uJmuJS/B67+e93AebM+XDQAitmpynymDbsjdxsVXBPpl/2uv13JjleTjDCptoJy2Yb8+lFSKLi6zuWV60nOgQ0aPewWRZpgjcxZkj5JznLLZnKQOEq8xmM9AMO7eFl0wBS94M6lgCL1u1SgNKofOCBvPy8qJJSbo4bAYonYuxjOVLtYzcCFLxqWv6op0fyQAfHrZLrGesMKBI6mydA/vPcIVD3a90rLC6IsNJW0niRlEYVUC7mjZ8uLyystLlocOzgiNPiJp5cFJgrTpMooNpVjq/IymPlCl7qrcqFAMusF57MploCXJhJ46EFF0+Oj1ViW0G5wprlQuFpfPwg1YtmKLH+NmpHlQx/wKrjl6BZDVxEV2swph3PPbGUD6BwJ2iqGn4oUP35MpdvlfRlrDrbxyNCqIKg7zkKgmCluTQKc1q2bubLd45cT0s6hUxjykHyjhBhWmPMgZWEvs0ul405Ab6ah0fibP3f4bDIY6KTnJ6aQwpTHqMK4wbOy/r/GEtA9iSrzbef8qynJiGPWY1QT8wGurRX9QVtj/jiNbX1+3P9ZHpHAHoO6EyJapTFAsop4+If/VUym/Rbv6ysViff1wc62oSE5XAQL/f98Q9jwrtxVAeN1BZaYcAH008S4NL/ibwNRpA7Yltl2Lxo84rFeYJRFcYV3l8zIlDCrtYYkDAzzqpZleiOyF66wWf+BUuLUFhgFK7OAmeClVMvIMxf33+wa5deQCOK4z6Y3UM5TWhyWxt4saHPB9HW6L9Jef9qxLbJOVmnDe7kiZKb95K6d+QTiaT0iEhdvum34Bd3z28NhYA9gUf7/cIsYXOccawcUtjzW2CPaJWYV7wBkK9lf/TnIKQsU5HR0fOpeAVCpNdogoyoUhtFfIPVjcgCqNAOXTOd+RhK6lYBPgFfwT3yUvhy+q7gsmTWQpRqcJGqiG5MZnCC8Bvi+C2mIhOT0+cOHN+1Ra7u5yYncsB7U5EYVTdbWFG/HoCUDJdYTZPio5SVrDgzbJIh7uKFy4MURjbwIVLvPN9jaBo/ZFvHvBlq/LyzTTvSaYozG0wGBg3s0FsShOcLkNy0UxHE2BatAHHla/OgaoDgxYh8wrz13PoVB954wPYkW3QjLf0birucFGXIvMUCuMJVVHhlkKb2x1OTG05FZOe/v5PKdeyv7m7brWIu/3Oe3fXssKa8Qme2/Kylxjsbzu0GNb29pwY99Kec7NPSkBmc7k0fbz2BJAs71VSre00Z7Vsf3/fvNmSpnAERrnplPZPPLm6UoiHex7XO6F+S7tNqYRt37y9OWL63sIeiiOTysP7TyGW1YZ7ezrxzk4C8e1tZWKDFDb8POayryJkbNeVvKotWOGAuS215AZ7i+wiey617bCRWYXRWVRS9xr0sLT0uYhTFM5/mylkvwOffTLe0oKTOcr7O0T8He3/xvvt7KFZ835bcSzKHh4aEff7fuLHJo6NMRuNWr/5Pkjm1f+MKMD72Ix4Y6MJcX4YHTTwkH+b/adCi4YKnzVXeP6qqLbNef9UIW5kZ2dnzZ004c1tYbzGtMDbsR18dAARe27Z38FBbeLVdiPR7fk5nTjp1qcrfJfQcHW1KrH2lj9qFXhT7vW65S/2YpbIe2mKP8sS3+NE7KRS7WSFVUvhTbTLy0tjptNpZYVPTioTO/tZv2ltKy90VuGq1oT35+KJ41f2Lu0jFf5K9l8AAAD//4N+SSTpkEOFAAAAAElFTkSuQmCC

图片如下:

image

识别结果:

$ python3 ocr1.py 
欢迎使用ddddocr,本项目专注带动行业内卷,个人博客:wenanzhe.com
训练数据支持来源于:http://146.56.204.113:19199/preview
爬虫框架feapder可快速一键接入,快速开启爬虫之旅:https://github.com/Boris-code/feapder
谷歌reCaptcha验证码 / hCaptcha验证码 / funCaptcha验证码商业级识别接口:https://yescaptcha.com/i/NSwk7i
识别结果: 00470

二,处理:

为了提高识别比率,对图片做一定的处理:转为灰度+去噪

代码:

import base64
from ddddocr import DdddOcr
import cv2
import numpy as np
from PIL import Image
import io
from PIL import Image, ImageFilter
from io import BytesIOocr = DdddOcr(det=False, ocr=True)data_url = "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAPAAAABQCAMAAAAQlwhOAAAA81BMVEUAAAB/TiCdbD6GVSdoNwnPnnB7ShyDUiTDkmR5SBrVpHbMm22FVCa5iFrUo3WUYzW9jF5yQRPDkmS/jmCFVCZyQRNnNghvPhCVZDZfLgCbajy8i116SRundkjXpni7ilx2RRdlNAbRoHJuPQ/OnW+5iFrbqnyvflCFVCaIVynWpXfFlGaCUSOPXjB2RRdkMwV8Sx3JmGqcaz2kc0XWpXeMWy3ZqHrOnW+xgFJxQBJsOw1qOQuHViiATyG4h1m8i12ndkiUYzV2RRe7ilyHViiMWy2EUyWSYTPQn3GUYzXIl2lpOAraqXuNXC51RBbQn3F8Sx3mH0b2AAAAAXRSTlMAQObYZgAABnpJREFUeJzkm+lOIzkQx11CZEbiEEggAmHEh1E4IsQlQFGiwHAI5kMP7/84K9Lddl0++grH1q5GuGOX6+e/XbY7YD6JXX90AAu26+tvQnyRWjGZd612LIuwiwsf8WZNj2trn5zY83xzszYxLtzXdPIBFuQ9T3Ryf8+JR/Uj+kA7P08mZuXR6IsS125Zjfdrjk59+6rzob45XjAQqLe1kGiwhaLRbVbJO8zNh721pRP/qBxVWjDzcCo2m83SiaEEzvt5lTU8vD/CxFXGvIjEjn27Ct/QPoiZ11eFWLcIb+KYj8o4cCSpISTZzY0jBjSZ/QrXs0Te0QjksLdrTGFTdKD25V3YrdmIw9qAujDMqAEDHJdRdBkBTpodKOw6o97l4II5Pj6ulzYj3boC2yE6nFJivXCs+cfHoQ2L2TTep8sVKAYD3hhaNDlVFf5yTWlh/OIPptPI7U1ZpcD17jBjqILK+NS677y/BLG8vbEOkcKeRNmpwnwwRd9uJmuJS/B67+e93AebM+XDQAitmpynymDbsjdxsVXBPpl/2uv13JjleTjDCptoJy2Yb8+lFSKLi6zuWV60nOgQ0aPewWRZpgjcxZkj5JznLLZnKQOEq8xmM9AMO7eFl0wBS94M6lgCL1u1SgNKofOCBvPy8qJJSbo4bAYonYuxjOVLtYzcCFLxqWv6op0fyQAfHrZLrGesMKBI6mydA/vPcIVD3a90rLC6IsNJW0niRlEYVUC7mjZ8uLyystLlocOzgiNPiJp5cFJgrTpMooNpVjq/IymPlCl7qrcqFAMusF57MploCXJhJ46EFF0+Oj1ViW0G5wprlQuFpfPwg1YtmKLH+NmpHlQx/wKrjl6BZDVxEV2swph3PPbGUD6BwJ2iqGn4oUP35MpdvlfRlrDrbxyNCqIKg7zkKgmCluTQKc1q2bubLd45cT0s6hUxjykHyjhBhWmPMgZWEvs0ul405Ab6ah0fibP3f4bDIY6KTnJ6aQwpTHqMK4wbOy/r/GEtA9iSrzbef8qynJiGPWY1QT8wGurRX9QVtj/jiNbX1+3P9ZHpHAHoO6EyJapTFAsop4+If/VUym/Rbv6ysViff1wc62oSE5XAQL/f98Q9jwrtxVAeN1BZaYcAH008S4NL/ibwNRpA7Yltl2Lxo84rFeYJRFcYV3l8zIlDCrtYYkDAzzqpZleiOyF66wWf+BUuLUFhgFK7OAmeClVMvIMxf33+wa5deQCOK4z6Y3UM5TWhyWxt4saHPB9HW6L9Jef9qxLbJOVmnDe7kiZKb95K6d+QTiaT0iEhdvum34Bd3z28NhYA9gUf7/cIsYXOccawcUtjzW2CPaJWYV7wBkK9lf/TnIKQsU5HR0fOpeAVCpNdogoyoUhtFfIPVjcgCqNAOXTOd+RhK6lYBPgFfwT3yUvhy+q7gsmTWQpRqcJGqiG5MZnCC8Bvi+C2mIhOT0+cOHN+1Ra7u5yYncsB7U5EYVTdbWFG/HoCUDJdYTZPio5SVrDgzbJIh7uKFy4MURjbwIVLvPN9jaBo/ZFvHvBlq/LyzTTvSaYozG0wGBg3s0FsShOcLkNy0UxHE2BatAHHla/OgaoDgxYh8wrz13PoVB954wPYkW3QjLf0birucFGXIvMUCuMJVVHhlkKb2x1OTG05FZOe/v5PKdeyv7m7brWIu/3Oe3fXssKa8Qme2/Kylxjsbzu0GNb29pwY99Kec7NPSkBmc7k0fbz2BJAs71VSre00Z7Vsf3/fvNmSpnAERrnplPZPPLm6UoiHex7XO6F+S7tNqYRt37y9OWL63sIeiiOTysP7TyGW1YZ7ezrxzk4C8e1tZWKDFDb8POayryJkbNeVvKotWOGAuS215AZ7i+wiey617bCRWYXRWVRS9xr0sLT0uYhTFM5/mylkvwOffTLe0oKTOcr7O0T8He3/xvvt7KFZ835bcSzKHh4aEff7fuLHJo6NMRuNWr/5Pkjm1f+MKMD72Ix4Y6MJcX4YHTTwkH+b/adCi4YKnzVXeP6qqLbNef9UIW5kZ2dnzZ004c1tYbzGtMDbsR18dAARe27Z38FBbeLVdiPR7fk5nTjp1qcrfJfQcHW1KrH2lj9qFXhT7vW65S/2YpbIe2mKP8sS3+NE7KRS7WSFVUvhTbTLy0tjptNpZYVPTioTO/tZv2ltKy90VuGq1oT35+KJ41f2Lu0jFf5K9l8AAAD//4N+SSTpkEOFAAAAAElFTkSuQmCC"def data_url_to_image(data_url):# 解析URL字符串mediatype, data = data_url.split(',',1)encoding = mediatype.split(';')[1] if ';' in  mediatype  else '' # 解码数据if encoding =='base64':data = base64.b64decode(data)# 创建Image对象image = Image.open(BytesIO(data))return imageimage = data_url_to_image(data_url)
image.save('x1.png')# 打开图像并进行处理
image = Image.open('x1.png')
# 转换为灰度图像
image = image.convert('L')
# 去噪
image = image.filter(ImageFilter.MedianFilter())
# 保存处理后的图像
image.save('x1_opted.png')with open('x1_opted.png', 'rb') as f:img_bytes = f.read()result = ocr.classification(img_bytes)print(f"识别结果:{result}")  # 处理后的with open('x1.png', 'rb') as f:img_bytes = f.read()result = ocr.classification(img_bytes)print(f"识别结果:{result}")  # 原图的输出

结果 :

$ python3 ocr1.py 
欢迎使用ddddocr,本项目专注带动行业内卷,个人博客:wenanzhe.com
训练数据支持来源于:http://146.56.204.113:19199/preview
爬虫框架feapder可快速一键接入,快速开启爬虫之旅:https://github.com/Boris-code/feapder
谷歌reCaptcha验证码 / hCaptcha验证码 / funCaptcha验证码商业级识别接口:https://yescaptcha.com/i/NSwk7i
识别结果:004707
识别结果:00470

原图:

image

处理后图:

image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/973464.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

`np.array` 和 `np.ndarray`是什么关系?

np.array 和 np.ndarray 是 NumPy 中两个密切相关但用途和行为完全不同的概念。理解它们的关系是掌握 NumPy 的关键之一。🔹 1. np.ndarray:NumPy 数组的底层类(类型)numpy.ndarray 是 所有 NumPy 数组对象的实际…

大数据部门和AI部门边界

目录背景和价值1. 大数据部门的职责 (Big Data Department - 平台建设方)2. AI部门的职责 (AI Department - 价值应用方)总结:技术总监的战略划分参考资料 背景和价值 这是一个在组织架构中非常关键的问题,也是检验技…

Post Processing

Post Processing后处理 Unity Grab URP Render Feature Godot screen_texture Godot 面片法

工作草稿

自行车产业链发展的三种模式 一、加工增值模式进口高端碳纤维(德国织布机) 17%关税车架、车把 8%关税 → 增值 50%高端自行车日本禧玛诺车零件关税 20% 增值 30% 国内销往鱼杆、船桨、高尔夫 (昆山、吉林、呼和浩特…

【Rust编程:从新手到大师】Rust 环境搭建(详细版) - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

OOP第一到三次作业总结 -单部电梯调度

一、前言 博主近期疏于学业,故而三次作业均没有完整实现出来,因此这是一篇反思文,同博主一样起步浑浑不清者,可借此文规避一些低效的思路。 (博主依赖ai成瘾,借主播血泪教训,建议读者切忌一味信赖ai!应当试着自…

2025年11月南通宠物医疗市场深度分析:专业服务与行业规范的标杆选择

在宠物经济快速发展的浪潮中,宠物医疗行业正经历从"基础服务"向"专业医疗"的深刻转型。据最新行业报告显示,南通地区宠物医疗市场规模年均增长达16.8%,宠物主人对医疗服务的期望已从"能看…

用户亲测!用 DiffMind 用 AI,省一半时间还出效果,小白也能轻松上手

用户亲测!用 DiffMind 用 AI,省一半时间还出效果,小白也能轻松上手“用 AI 写文案要切 3 个平台,改简历改 5 遍还不对,查个信息怕 AI 瞎编”—— 如果你也有这些糟心经历,那一定要试试DiffMind(官网www.diffmin…

软工团队作业3

作业信息这个作业属于哪个课程 首页 - 计科23级34班 - 广东工业大学 - 班级博客 - 博客园这个作业要求在哪里 团队作业3--需求改进&系统设计 - 作业 - 计科23级34班 - 班级博客 - 博客园这个作业的目标 明确团队项…

电梯调度迭代编程作业复盘

一、对三次电梯调度题目集的整体认知 (一)知识点覆盖与考察重点 三次电梯调度题目集聚焦面向对象编程核心知识点与工程化开发能力,核心考察内容可归纳为三类: 设计原则:核心是单一职责原则。从第一次的 “单类包揽…

球坐标系的大运动方程组

球坐标系的大运动方程组P=P(λ, φ, r) 其中,λ——经度φ——纬度r——地心到空间点的距离

【数据库】navicat的下载以及数据库约束 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

i2c linux

您提到的 "i2c linux" 可能是指与 I2C(I2C)总线 相关的 Linux 系统操作。I2C 是一种常用的串行通信协议,用于连接微控制器、传感器、EEPROM、Flash 存储器等设备。在 Linux 系统中,I2C 通常通过 i2c-dev…

hyper-v linux

您提到的 "Hyper-V Linux" 是一个与 Windows Hyper-V 技术相关的概念,但 Hyper-V 是 Windows 操作系统的功能,并不支持在 Linux 系统上直接运行。因此,Hyper-V Linux 并不是一个实际存在的功能或工具。?…

二维费用背包 尽量前后一直把好像也没关系

看清题目问的是什么 读懂题目vw是什么 include <bits/stdc++.h> using namespace std; int dp[105][105];//i忍耐度杀了 j时候的经验值 int v[105];int w[105]; int main() { int n,m,k,s; while(cin>>n&g…

详细介绍:在Windows中的Docker与WSL2的关系,以及与WSL2中安装的Ubuntu等其它实例的关系

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

ThinkPHP5 RCE+Linux find提权渗透实战:原理+复现(CVE-2018-20062) - 详解

ThinkPHP5 RCE+Linux find提权渗透实战:原理+复现(CVE-2018-20062) - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-fam…

团队作业3--需求改进与系统设计

这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/Class12Grade23ComputerScience这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/Class12Grade23ComputerScience/homework/134731.需求改进 功能分…

OI 笑传 #33

仮面の街今天是 bct Day 3,赛时 \(100+20+15+50=185\),rk.11。 没有挂分很舒适。 评价是 ok 场,复习(?)了下期望这一块。写了 T1,T4 的拍子。 T1 考虑从小到大填数,这样这个数的排名就是后面空位的数量,填到对…

PySpark - Read Data from PostgreSQL

PySpark - Read Data from PostgreSQL jdbc_url = "jdbc:postgresql://localhost:5432/postgres" properties = {"user": "postgres","password": "postgrespwd",&…