git官方库PaddleOCR提供的几种模型库;github拉下来的源码和pip包(CLI)使用;supervisorctl部署踩坑;PaddleOCR文本检测模块训练实战(踩坑)

news/2026/1/23 11:57:07/文章来源:https://www.cnblogs.com/asphxiasea/p/19495284

1.git官方库PaddleOCR提供的几种模型库;
PaddleOCR-VL - 通过 0.9B VLM 进行多语言文档解析。
该模型是专为文档解析量身定制的 SOTA 和资源高效模型,支持 109 种语言,擅长识别复杂元素(例如文本、表格、公式和图表),同时保持最小的资源消耗。

PP-OCRv5——通用场景文本识别
单模型支持五种文本类型(简体中文、繁体中文、英文、日文和拼音),准确率提升13%。解决了多语言混合文档识别的难题。

PP-StructureV3——复杂文档解析器,
能够智能地将复杂的PDF和文档图像转换为Markdown和JSON文件,并保留其原始结构。在公开基准测试中,其性能优于众多商业解决方案。完美地维护文档布局和层级结构。

PP-ChatOCRv4——智能信息提取
原生集成了ERNIE 4.5,能够从海量文档中精准提取关键信息,准确率比上一代提升15%。它能让文档“理解”您的问题,并提供准确的答案。

如果需要使用以上所有功能
python -m pip install "paddleocr[all]"

2.github拉下来的源码和pip包(CLI)使用;
👉因为官方的文档中使用的是python tools/train.py,走的是GitHub源码,所以,要微调模型,就必须去GitHub下载源码。
👉之前只是使用,仅仅用pip 包方式导入,调用。

场景 用的 PaddleOCR
paddleocr ocr ... pip 包(CLI)
python tools/train.py GitHub 源码
微调模型 只能走源码
线上 API 通常封源码

3.supervisorctl部署踩坑
👉因为刚刚修改了虚拟环境,安装及卸载了一些库,如numpy,影响到了正式环境的运行
Supervisor 不会自动感知你“换了虚拟环境”
👉 必须显式指定 Python 路径,并重载 / 重启服务

4.PaddleOCR文本检测模块训练实战
下载PaddleOCR源码后,看tools/train.py的位置,运行以下命令:
第一次训练非常顺利:
python3 PaddleOCR/tools/train.py -c PaddleOCR/configs/det/PP-OCRv5/PP-OCRv5_server_det.yml \指定yml文件
-o Global.pretrained_model=PP-OCRv5_server_det_pretrained.pdparams \指定官方预训练(或者已训练的模型,与后面的踩坑有关)文件
Train.dataset.data_dir=./
Train.dataset.label_file_list='[label_text/train.txt]'
Eval.dataset.data_dir=./
Eval.dataset.label_file_list='[label_text/val.txt]'

👉 训练完以后,必须导出
python3 PaddleOCR/tools/export_model.py -c PaddleOCR/configs/det/PP-OCRv5/PP-OCRv5_server_det.yml -o
Global.pretrained_model=output/PP-OCRv5_server_det/best_accuracy.pdparams
Global.save_inference_dir="./PP-OCRv5_server_det_v2/"

👉第二次想在之前模型上继续训练,我将导出的模型拿来训练,一直不行
👉搞了半天发现预训练模型后缀时.pdparams,然后才去找导出之前的模型,终于是成功了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1204791.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026东四省最新艺考集训学校 TOP5 评测!辽宁、沈阳等地优质培训机构权威榜单发布,助力艺考生升学梦想

随着艺术升学竞争日趋激烈,专业的艺考集训成为艺考生实现名校梦想的关键助力。本榜单基于教学成果、师资力量、课程体系、硬件设施四大维度,结合东四省艺考生及家长口碑反馈,权威解析2026年五大艺考集训品牌综合实力…

uni-app 不同页面EventChannel通信

详情页 假设在列表页中你有某个方法来监控连接状态(如通过 WebSocket 或定时器),并且一旦连接断开,就通知详情页。 // 列表页代码 async monitorConnection(item) {// 假设你有一个函数来监控设备连接状态变化let …

超越期待:为什么说上海博禹泵业是国产水泵的“性价比王牌”?

我所在单位主要负责市政排水和应急防汛工作。2023年汛期前,我们采购了上海博禹泵业有限公司的真空辅助自吸泵和便携式防汛潜水泵。经过一年多的使用,我对博禹水泵的性能有了全面的了解。 初次采购时,我们比较了多家…

【ACM出版】第七届计算机信息和大数据应用国际学术会议(CIBDA 2026)

【ACM出版】 第七届计算机信息和大数据应用国际学术会议(CIBDA 2026) 2026 7th International Conference on Computer Information and Big Data Applications 在这里看会议官网详情 大会时间:2026年3月20-22日 大…

文档识别架构思路整理;

1.文档识别架构思路整理 “直接把整个文件给 LLM”本来就不对 👉 Paddle 负责“看清楚”,LLM 负责“想明白” 1️⃣ LLM 的天然限制 上下文窗口有限(即便 128k 也不够 PDF / 扫描件) 成本高 注意力会被无关内容稀…

2026年苏州夹爪供应商深度解析:谁将成为您的柔性自动化伙伴?

一支由高性能仿生有机硅制成的“隐形手套”,正在长三角的工业产线上,为那些价值不菲、表面娇贵的工件提供着零损伤搬运服务。 苏州柔触机器人科技有限公司在苏州及深圳打造的用户体验与测试服务中心,能实现15分钟现…

2025年电滑环市场占有率排行出炉,滑环/旋转接头/集电环/电环/气路滑环/光电滑环,电滑环源头厂家哪家权威

在工业4.0与智能制造浪潮的推动下,电滑环作为旋转设备中实现电信号、气液传输的核心部件,其市场需求呈现爆发式增长。据第三方机构统计,2025年中国电滑环市场规模突破45亿元,但行业集中度不足30%,中小厂商低价竞争…

2026 果树种植户必看:高适配分拣机械手供应商推荐

随着智慧农业的快速发展,果树分拣环节的自动化升级成为提升产业效率的关键。果树分拣机械手凭借精准的分拣能力、稳定的作业表现,有效解决了传统人工分拣效率低、损伤率高、人力短缺等痛点。苏州柔触机器人科技有限公…

2026年广州口碑好的Drupal服务企业排行榜,哪家性价比高?

本榜单依托全维度市场调研与真实行业口碑,深度筛选出五家标杆企业,为企业选型提供客观依据,助力精准匹配适配的Drupal服务伙伴。 TOP1 推荐:宁波思艾特软件有限公司 推荐指数:★★★★★ | 口碑评分:亚洲领先的D…

2026聚乙烯蜡/氧化聚乙烯蜡/裂解聚乙烯蜡厂家推荐,专业生产,品质可靠

2026聚乙烯蜡/氧化聚乙烯蜡/裂裂解聚乙烯蜡厂家推荐:专业生产与品质可靠的价值解析 在精细化工领域,聚乙烯蜡、氧化聚乙烯蜡及裂解聚乙烯蜡作为关键的添加剂与改性剂,其性能的细微差异直接影响着下游塑料加工、涂料…

监控指标

Kubernetes 告警规则清单生命周期类告警类别 指标 / 事件 常见根因 告警信息 / 内容 实际 PromQL生命周期 Pod 状态异常 资源不足 / 调度约束 / 镜像拉取慢 命名空间: {{$labels.namespace}} / Pod: {{$labels.pod_nam…

YOLOv9 Torchaudio安装必要性:音频模块是否冗余?

YOLOv9 Torchaudio安装必要性:音频模块是否冗余? 你有没有在使用YOLOv9镜像时,看到torchaudio0.10.0这个依赖项,心里闪过一个疑问:“这玩意儿是干嘛的?我做目标检测,又不做语音识别&#xff0c…

东北卓越名车的配件供应靠谱吗,深度剖析供应体系!

本榜单依托东北地区高档车维修改装市场的全维度调研与真实车主口碑反馈,深度筛选出五家专注路虎捷豹服务的标杆机构,为车主解决怕被坑、怕修坏、怕等、怕假货、没地方去的核心痛点,助力精准匹配专业可靠的服务伙伴。…

评测报告:浙江广告公司在品牌塑造中的角色与价值,当下广告优质品牌选购指南

在美妆行业高度同质化的竞争环境中,品牌视觉设计已成为企业突破市场壁垒、建立差异化认知的核心抓手。作为深耕美妆领域17年的专业机构,杭州帕特广告策划有限公司(以下简称“帕特广告”)凭借对行业趋势的精准洞察与…

FSMN-VAD服务守护:后台常驻进程配置教程

FSMN-VAD服务守护:后台常驻进程配置教程 1. 为什么需要让FSMN-VAD服务“一直在线” 你可能已经成功跑通了FSMN-VAD语音端点检测的Web界面——上传一段录音,点击检测,几秒后看到清晰的时间戳表格。但很快会发现一个问题:关掉终端…

光伏线缆制造厂哪个值得选,品恩泰克品质保障受认可

2026年十五五规划推动能源绿色转型提速,光伏产业作为可再生能源主体赛道迎来爆发式增长,光伏线缆作为系统能量纽带,其定制工期效率、产品线覆盖广度及品质稳定性直接决定光伏项目的落地速度与长期收益。然而当前市场…

沪苏浙皖设备模型服务商推荐,聚景模型上榜了吗?

一、基础认知篇 问题1:什么是设备模型服务商?和普通模型制作商有何区别? 设备模型服务商是以工业、机械、航空航海等领域的设备为核心服务对象,提供从需求调研、设计优化到模型制作、交付维护全链路解决方案的专业…

2025浙江山地速降基地大揭秘!口碑爆棚的TOP5来袭,山地速降/山地车骑行/山地车/户外骑行,山地速降基地口碑推荐

随着全民健身热潮的深入与户外运动的兴起,山地速降这项集技巧、勇气与自然探索于一体的极限运动,正从专业小众圈层走向更广泛的运动爱好者。浙江,凭借其得天独厚的丘陵地貌与成熟的文旅产业基础,已成为国内山地车运…

2026年浑南专业的车衣改色实体店推荐榜单,车衣改色/太阳膜/贴车衣/汽车车衣/隐形车衣/汽车贴膜,车衣改色定制哪家好

随着汽车消费市场个性化需求激增,车衣改色已成为车主表达审美、保护车漆的核心选择。据行业数据显示,2025年国内车衣改色市场规模突破120亿元,年复合增长率达25%,消费者对施工工艺、产品品质及服务体验的关注度持续…

在线教育平台应用:学生答题语气分析提升教学反馈

在线教育平台应用:学生答题语气分析提升教学反馈 1. 引言:当AI听懂学生的“语气”,教育反馈迎来质变 你有没有遇到过这样的情况?在线课堂上,学生回答问题时声音低沉、语速缓慢,看起来心不在焉&#xff1b…