文字识别准确率

news/2025/11/14 1:12:39/文章来源:https://www.cnblogs.com/linlikun/p/19220029
import easyocr
import cv2
import os
import numpy as npdef calculate_ocr_accuracy(image_path, ground_truth_text=None):reader = easyocr.Reader(['ch_sim', 'en'])try:image = cv2.imread(image_path)if image is None:raise ValueError(f"无法读取图片: {image_path}")results = reader.readtext(image)recognized_text = ""confidence_scores = []for (bbox, text, confidence) in results:recognized_text += text + " "confidence_scores.append(confidence)recognized_text = recognized_text.strip()print("=" * 50)print("OCR识别结果:")print("=" * 50)for i, (bbox, text, confidence) in enumerate(results):print(f"文本块 {i+1}: '{text}' (置信度: {confidence:.4f})")print(f"\n完整识别文本: {recognized_text}")avg_confidence = np.mean(confidence_scores) if confidence_scores else 0print(f"\n平均置信度: {avg_confidence:.4f}")if ground_truth_text:accuracy = calculate_text_accuracy(ground_truth_text, recognized_text)print(f"文本准确率: {accuracy:.2f}%")return {'recognized_text': recognized_text,'ground_truth': ground_truth_text,'accuracy': accuracy,'avg_confidence': avg_confidence,'details': results}else:return {'recognized_text': recognized_text,'avg_confidence': avg_confidence,'details': results}except Exception as e:print(f"处理图片时出错: {e}")return Nonedef calculate_text_accuracy(ground_truth, recognized):gt_clean = ''.join(ground_truth.split()).lower()rec_clean = ''.join(recognized.split()).lower()distance = levenshtein_distance(gt_clean, rec_clean)max_len = max(len(gt_clean), len(rec_clean))if max_len == 0:return 100.0accuracy = (1 - distance / max_len) * 100return accuracydef levenshtein_distance(s1, s2):if len(s1) < len(s2):return levenshtein_distance(s2, s1)if len(s2) == 0:return len(s1)previous_row = range(len(s2) + 1)for i, c1 in enumerate(s1):current_row = [i + 1]for j, c2 in enumerate(s2):insertions = previous_row[j + 1] + 1deletions = current_row[j] + 1substitutions = previous_row[j] + (c1 != c2)current_row.append(min(insertions, deletions, substitutions))previous_row = current_rowreturn previous_row[-1]def batch_ocr_accuracy_test(image_folder, ground_truths):total_accuracy = 0total_confidence = 0count = 0print("开始批量OCR准确率测试...")print("=" * 60)for filename, truth_text in ground_truths.items():image_path = os.path.join(image_folder, filename)if os.path.exists(image_path):print(f"\n处理图片: {filename}")result = calculate_ocr_accuracy(image_path, truth_text)if result and 'accuracy' in result:total_accuracy += result['accuracy']total_confidence += result['avg_confidence']count += 1if count > 0:print("\n" + "=" * 60)print("批量测试结果汇总:")print(f"测试图片数量: {count}")print(f"平均准确率: {total_accuracy/count:.2f}%")print(f"平均置信度: {total_confidence/count:.4f}")print("=" * 60)def main():image_path = r"C:\Users\18306\Desktop\picture\test_image.jpg"if not os.path.exists(image_path):print(f"错误: 图片文件不存在 - {image_path}")returnprint("开始OCR识别...")result = calculate_ocr_accuracy(image_path)if result:print("\n识别完成!")else:print("识别失败!")if __name__ == "__main__":main()

image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/964867.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【d-bus】gdbus-codegen 使用教程

参考文章:https://blog.csdn.net/qq_40650634/article/details/149168037基本概念与编程教程参考一下文章 1.Gdbus 的编程教程:https://blog.csdn.net/adlindary/article/details/80167840 2.DBUS 基础概念:https:/…

logstash配置和启动

第二步:配置 Logstash(接收 Filebeat 日志,处理后发送到 Elasticsearch) 1. 创建 Logstash 管道配置文件 进入 Logstash 安装目录的 config 文件夹(如 C:\logstash-9.2.1\config),新建一个文件 springcloud-pip…

最近改论文的诡异经历…… - BUAA

事情是这样的: 昨晚凌晨两点,我还在和论文死磕。 不是不想睡,是查重率死活压不下去,知网报告上那一片标红看着像案发现场。 室友早就躺平,鼾声如雷。我盯着屏幕,脑子已经不会转了,复制粘贴了一堆“智能降重”网…

newDay21

1.背背单词,把u校园和英语ppt弄了,再写写离散数学 2.还差一堆任务,看看能弄多少弄多少吧 3.没啥问题

2025广东封闭式管理学校最新TOP5评测:重塑少年言行,见证成长蜕变

随着青少年心理健康与综合素质培养需求的持续攀升,封闭式管理教育机构已成为解决青少年成长问题的重要力量。本榜单基于安全管理规范、课程专业度、心理干预能力、家长满意度四大核心维度,结合行业协会实地走访与第三…

2025年广东军事化训练学校/机构最新TOP5权威评测:铸就坚毅品格,领航成长之路

随着社会对青少年综合素质培养的重视,军事化训练作为塑造品格、提升能力的重要途径,市场需求持续攀升。本榜单基于技术特色、课程体系、实战效果、家长口碑四大维度,结合行业调研数据与用户反馈,精选广东地区五家实…

2025年广东青少年感恩教育学校/机构最新TOP5推荐:家庭教育、心理健康,科学评测

随着青少年心理健康与家庭关系问题日益受到社会关注,专业的感恩教育与家庭教育机构成为家庭改善亲子关系、引导孩子健康成长的重要选择。本榜单基于教育资质、课程体系、师资力量、实践效果四大核心维度,结合广东省教…

2025广东法制教育机构/学校最新TOP5评测:心理健康、素质拓展、行为矫正全覆盖

随着青少年法治意识培养成为社会教育重点,专业法制教育机构的选择备受家长关注。本榜单基于教学资质、课程体系、师资力量、硬件设施四大核心维度,结合广东省教育厅备案信息及家长口碑数据,权威解析2025年广东地区五…

2025年广东青少年素质拓展训练学校最新TOP5实力榜:以规范养习惯,护航成长之路

随着青少年心理健康与综合素质教育需求的不断攀升,专业素质拓展训练机构成为教育市场的重要力量。本榜单基于基地规模、资质认证、课程体系、转化效果四大核心维度,结合广东省教育厅备案信息及家长满意度调研数据,权…

2025年广东青少年行为矫正学校TOP5权威评测:科学矫正护航成长未来

随着青少年心理健康问题日益凸显,专业行为矫正机构成为家庭解决教育难题的重要选择。本榜单基于办学资质、矫正效果、师资力量、安全保障四大核心维度,结合广东省教育厅备案信息及家长真实反馈,深度解析2025年广东地…

高级程序语言设计第五次个人作业

这个作业属于哪个课程 <班级的链接>这个作业要求在哪里 <作业链接>学号 092300303姓名 池博洋@目录一、设计作业1.使得程序遇到空格符时结束2.文件重定向,小写转大写3. 四则运算计算器4.混合读入字符、数…

2025年贵州贵阳母婴护理机构最新TOP5评测:守护母婴健康的专业力量

随着母婴健康意识的提升,专业母婴护理机构成为新家庭的重要选择。本榜单基于环境设施、人员资质、服务质量、安全管理四大核心维度,结合行业服务标准与用户口碑数据,全面解析2025年贵阳五大母婴护理品牌综合实力,为…

2025贵州贵阳月子会所最新TOP5评测:产后恢复优选,守护母婴健康

随着现代家庭对产后护理需求的升级,专业月子会所已成为新生代父母的核心选择。本榜单基于服务专业性、环境设施、护理团队、客户口碑四大维度,结合《2025中国母婴护理行业发展报告》及本地宝妈真实评价,权威解析贵阳…

2025年贵州贵阳月子中心最新TOP5专业评测:守护母婴健康新标杆

随着母婴护理需求的精细化升级,贵阳月子中心市场呈现专业化、高端化发展趋势。本榜单基于服务资质、护理团队专业性、设施环境、客户口碑四大核心维度,结合行业最新标准与真实用户反馈,权威解析2025年贵州贵阳五大月…

Excel VBA 自定义排序

现有数据如下:此时,如果需要根据单元格底色来排序,红色在上,其次是黄色,最后是白色(其实是无底色)。那么代码如下: Sub te()Dim wbk As WorkbookDim sht As WorksheetDim last_row As IntegerDim iCounter As …

基于GWO灰狼优化的XGBoost序列预测算法matlab仿真

1.算法运行效果图预览 (完整程序运行后无水印)3.部分核心程序 (完整版代码包含详细中文注释和操作步骤视频)................................................................ %最大迭代次数 paramters.maxiter …

2025广东住房公积金提取机构最新TOP5评测:因为正规,所以高效

在住房公积金提取需求日益增长的背景下,选择专业可靠的代办服务机构成为许多人高效解决公积金提取难题的关键。本榜单基于服务专业性、业务覆盖范围、客户满意度等核心维度,结合市场反馈与行业数据,对广东及周边地区…

2025广东公积金提取代办中介最新TOP5评测:高效引领行业合规标准

随着住房公积金在居民生活中的重要性日益凸显,公积金提取代办服务需求持续攀升。本榜单依据合规资质、服务覆盖范围、客户满意度及办理效率四大核心维度,结合行业权威数据与用户反馈,对广东地区公积金代办机构进行综…

2025年深圳公积金提取最新TOP5评测:专业高效合规,引领行业标准

随着社会经济的发展,公积金作为一项重要的住房保障制度,其提取需求日益增长。然而,公积金提取流程复杂、政策多变,让许多人感到困扰。专业的公积金提取服务机构应运而生,为大众提供便捷、高效的服务。本榜单基于机…