OcrLicenseVo

news/2025/9/26 10:24:01/文章来源:https://www.cnblogs.com/exmyth/p/19113001
public static OcrLicenseVo parseOcrLicense(OcrResultVo item) {int[][][] dtPolyList = new int[9][2][2];for (int i = 0; i < item.getRecTexts().size(); i++) {String value = StringUtils.trimToEmpty(item.getRecTexts().get(i));if(StringUtils.anyContains(BREAK_NAME, value)){break;}if(StringUtils.isBlank(value) && StringUtils.anyContains(CONTINUE_NAME, value)){continue;}short idx;if(StringUtils.startsWith(value, "称")){idx = orgNameIndex;int[][] dtPoly = null;if(StringUtils.length(value) > 1){item.getRecTexts().set(i, StringUtils.substring(value, 1));dtPoly = item.getDtPolys().get(i-1);} else {dtPoly = item.getDtPolys().get(i);}dtPolyList[idx] = dtPoly;}else if(StringUtils.startsWith(value, "注册资本")){idx = capitalIndex;if(StringUtils.length(value) > 4){item.getRecTexts().set(i, StringUtils.substring(value, 4));}int[][] dtPoly = item.getDtPolys().get(i);dtPolyList[idx] = dtPoly;}else if(StringUtils.startsWith(value, "成立日期")){idx = establishDateIndex;int[][] dtPoly = item.getDtPolys().get(i);if(StringUtils.length(value) > 4){item.getRecTexts().set(i, StringUtils.substring(value, 4));}dtPolyList[idx] = dtPoly;} else if(StringUtils.startsWith(value, "营业期限")){idx = termIndex;int[][] dtPoly = item.getDtPolys().get(i);if(StringUtils.length(value) > 4){item.getRecTexts().set(i, StringUtils.substring(value, 4));}dtPolyList[idx] = dtPoly;} else if(StringUtils.startsWith(value, "法定代表人")){idx = legalPersonIndex;int[][] dtPoly = item.getDtPolys().get(i);if(StringUtils.length(value) > 5){item.getRecTexts().set(i, StringUtils.substring(value, 5));}dtPolyList[idx] = dtPoly;} else if(StringUtils.startsWith(value, "定代表人")){idx = legalPersonIndex;int[][] dtPoly = item.getDtPolys().get(i);if(StringUtils.length(value) > 4){item.getRecTexts().set(i, StringUtils.substring(value, 4));}dtPolyList[idx] = dtPoly;} else if(StringUtils.startsWith(value, "经营范围")){idx = scopeIndex;int[][] dtPoly = item.getDtPolys().get(i);if(StringUtils.length(value) > 4){item.getRecTexts().set(i, StringUtils.substring(value, 4));}dtPolyList[idx] = dtPoly;} else if(StringUtils.startsWith(value, "所")){idx = addressIndex;int[][] dtPoly = null;if(StringUtils.length(value) > 1){item.getRecTexts().set(i, StringUtils.substring(value, 1));dtPoly = item.getDtPolys().get(i-1);} else {dtPoly = item.getDtPolys().get(i);}dtPolyList[idx] = dtPoly;}else if(StringUtils.startsWith(value, "型")){idx = orgTypeIndex;int[][] dtPoly = null;if(StringUtils.length(value) > 1){item.getRecTexts().set(i, StringUtils.substring(value, 1));dtPoly = item.getDtPolys().get(i-1);} else {dtPoly = item.getDtPolys().get(i);}dtPolyList[idx] = dtPoly;} else {idx = getValueIndex(value);if(idx >= 0){int[][] dtPoly = item.getDtPolys().get(i);dtPolyList[idx] = dtPoly;}}}String[] licenseValues = new String[9];for (int i = 0; i < item.getRecTexts().size(); i++) {String value = StringUtils.trimToEmpty(item.getRecTexts().get(i));if(StringUtils.anyContains(BREAK_NAME, value)){break;}if(StringUtils.isBlank(value) && StringUtils.anyContains(CONTINUE_NAME, value)){continue;}if (LICENSE_PATTERN_SIMPLE.matcher(value).matches()) {licenseValues[creditCodeIndex] = value;log.info("scan value {} {} {}", i, 0, value);} else {int[][] currentPoly = item.getDtPolys().get(i);for (int index = 0; index < dtPolyList.length; index++) {int[][] dtPoly = dtPolyList[index];int hdiff = Math.abs(currentPoly[0][0] - dtPoly[0][0]);int vdiff = Math.abs(currentPoly[3][1] - dtPoly[3][1]);if(hdiff == 0 && vdiff == 0){log.info("scan name {} {} {}", i, index, value);break;}//看2.png 类和名(称}第0个坐标的横坐标太近,不是名称//看3.png 械和 住所第0个坐标的横坐标太远,不是地址if(Objects.nonNull(dtPoly) && hdiff <50 && vdiff <80){//index=0是营业执照,通过正则获取if(index == 0){continue;}licenseValues[index] = StringUtils.trimToEmpty(licenseValues[index]) + value;} else {log.info("skip {} {} {}", i, index, value);}}}}OcrLicenseVo ocrLicenseVo = new OcrLicenseVo();ocrLicenseVo.setCreditCode(licenseValues[creditCodeIndex]);ocrLicenseVo.setOrgName(licenseValues[orgNameIndex]);ocrLicenseVo.setCapital(licenseValues[capitalIndex]);ocrLicenseVo.setOrgType(licenseValues[orgTypeIndex]);ocrLicenseVo.setEstablishDate(licenseValues[establishDateIndex]);ocrLicenseVo.setLegalPerson(licenseValues[legalPersonIndex]);ocrLicenseVo.setAddress(licenseValues[addressIndex]);ocrLicenseVo.setScope(licenseValues[scopeIndex]);ocrLicenseVo.setTerm(licenseValues[termIndex]);return ocrLicenseVo;}

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/918107.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站设计过程中需要注意的问题安卓开发平台

MBTI简介 迈尔斯-布里格斯类型指标&#xff08;Myers–Briggs Type Indicator&#xff0c;MBTI&#xff09;是由美国作家伊莎贝尔布里格斯迈尔斯和她的母亲凯瑟琳库克布里格斯共同制定的一种人格类型理论模型。 该指标以瑞士心理学家卡尔荣格划分的8种心理类型为基础&#xff…

实用指南:C#上位机软件:1.7 熟悉VS并开启你的第一个C#程序

实用指南:C#上位机软件:1.7 熟悉VS并开启你的第一个C#程序2025-09-26 10:15 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !importa…

界面控件DevExpress WinForms v25.1 - AI聊天控件功能持续增强

界面控件DevExpress WinForms v25.1 - AI聊天控件功能持续增强DevExpress WinForms拥有180+组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForms能完美构建流畅、美观且易于使用的应…

K8S Deployment 学习

1. Deployment 是什么? Deployment 是 Kubernetes 最常用的控制器之一,用于声明式地管理一组 Pod 副本(通常是无状态应用),实现自动部署、滚动升级、回滚等功能。 它是生产环境推荐的工作负载类型。 底层自动创建…

网站建设与管理专业好找工作吗政务公开 加强门户网站建设

文章目录 前言1.CPU架构2.8086寄存器3. 指令流水线4.内存模型5.总线6.硬盘7 计算机启动过程BIOS8.BootLoader9.地址映射10.为什么boot loader要放在0x7c00这个位置&#xff1f;11 显卡是如何显示的12.汇编指令1.环境搭建 12 程序13 x86 汇编指令介绍 前言 x86汇编 详解x86汇编…

全面掌握 Py2neo 与 Neo4j:从容器化部署到高级应用实战 - 详解

全面掌握 Py2neo 与 Neo4j:从容器化部署到高级应用实战 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Co…

集训队作业1——qoj#11722

Hamilton 解题报告 题目大意 以如下方式给出一张带权无向图:点集为 \(\{1,2,\dots,n\}\),边有两种:\(\forall 1\leq i<n\),\((i,i+1)\) 之间有边权为 \(0\) 的边;\(\forall 1\leq i<j\leq n\) 且 \(\gcd(i,…

US$59 EGS ISN Authorization for CGDI Prog BMW MSV80 Key Programmer

EGS ISN Authorization for CGDI Prog BMW MSV80 Key ProgrammerNo need shipping. Please pass us serial number of your CGDI Prog BMW.Kindly note this authorization is free if you have CGDI Prog MB or CG Pr…

如何设置将浏览器网页临时禁用网页mathjax渲染直接查看latex编译前的文本

如何设置将浏览器网页临时禁用网页mathjax渲染直接查看latex编译前的文本 以上截图来源自网页:https://www.cnblogs.com/brave-light/p/18855706,感谢原作者的分享。

《IDEA 2025破解 长效使用指南:2099 年有效期配置实战之JetBrains全家桶有效》​

一、简介: intellij idea 是一款广泛使用的集成开发环境(ide),专为提高开发者的生产力和代码质量而设计。作为一个强大的多语言 ide,intellij idea 以其智能代码补全、代码分析和重构功能而闻名。intellij idea 提…

网站服务器安装教程视频教程在线制作软件

mars3d开发过程中点击面图层飞行定位&#xff0c;设置俯仰角度后&#xff0c;layer.flyTo({没有生效的排查思路记录&#xff0c;给大家提供一下以后排查定位问题的方向 问题场景相关代码&#xff1a; 1.项目本身代码&#xff1a; 2.精简了关键性代码后&#xff0c;就可以去ge…

手机网站怎么优化关键词在哪查询网站做的哪些外链

目录 引言一、为什么要开发图层顺序调整功能二、开发思路整理1. 拖拽库方案选择2. cesium图层api查询 三、代码编写1. 编写拖拽组件代码2. 修改原有图层管理代码2.1 图层加载移除的调整2.2 图层顺序与拖拽列表的矛盾 3. 编写图层移动代码 四、总结 引言 本教程主要是围绕Cesium…

软件开发公司如何利用大数据可视化设计提升决策效率

软件开发公司如何利用大数据可视化设计提升决策效率在当下信息爆炸的时代,企业每天都在处理海量数据。然而,数据本身并不等同于价值,关键在于如何让这些复杂的数据被看见、被理解、并最终转化为决策依据。大数据可视…

基于菲涅尔积分的角锥喇叭方向图计算

一、理论基础 角锥喇叭方向图计算基于以下公式: ​​E面方向图​​:H面方向图:其中菲涅尔积分函数:二、Matlab程序实现 2.1 菲涅尔积分函数定义 function [C,S] = fresnel_int(x)% 自适应辛普森积分法计算菲涅尔积…

Flask的ORM工具SQLAlchemy

Flask的ORM工具SQLAlchemy 一、ORM 是什么? ORM(Object-Relational Mapping,对象关系映射)是一种编程技术,用于在面向对象的编程语言与关系型数据库之间建立映射关系。它允许开发者使用面向对象的语法(如类、对象…

使用 Rust 和 Tesseract OCR 实现英文数字验证码识别

Rust 是一门注重内存安全并具有高性能的系统编程语言。它通过并发机制和零成本抽象提供了强大的功能。我们可以利用 Rust 的库来调用 Tesseract OCR 实现验证码识别。 一、安装与配置 安装 Tesseract OCR 同样,首先要…

构建复合AI系统以实现可扩展工作流

了解如何利用复合AI系统架构化模块化且安全的智能体工作流,以实现可扩展的企业自动化。生成式AI、大语言模型和多智能体编排的融合催生了一个变革性的概念:复合AI系统。这些架构超越了单个模型或助手,代表了智能代理…

seo网站诊断顾问微博wordpress插件

题目大意&#xff1a; 给定一段连续的整数&#xff0c;求出他们中所有偶数的平方和以及所有奇数的立方和。 解答&#xff1a; 坑你没商量&#xff01;要考虑输入数a,b的大小。如果a>b,需要交换a&#xff0c;b的值。转载于:https://www.cnblogs.com/ZJUT-jiangnan/p/3613488.…

Python HTTPS 爬虫实战,requests aiohttp Selenium 抓取技巧、HTTPS 问题与抓包调试(python https爬虫、反爬、抓包、证书处理)

本文讲解 Python HTTPS 爬虫实战:requests/ aiohttp/ Selenium 的使用场景、证书与 TLS 问题处理、反爬策略与代理池构建,及如何用 mitmproxy/Charles 和真机直连工具(抓包大师 Sniffmaster)做 HTTPS 抓包与握手分…

网站素材设计手机网站排名怎么做

介绍 最近在导入数据库数据, 有时候给的数据源文件,存在重复数据, 需要清除但是还需要保留一条记录的需求. 本文将介绍如何使用SQL Server来实现这个需求。 流程 下面是实现删除重复数据的流程&#xff0c;我们可以用表格展示每个步骤&#xff1a; 步骤 描述 步骤一 先…