Python学习之路(玖)-图像识别的实现

在 Python 中,图像识别对比通常涉及 图像相似度计算目标检测与匹配。-浅看一下就行,具体功能代码,后期会逐步上传资源。


一、技术方案

1. 图像相似度计算

  • 目标:计算两幅图像的相似度。
  • 工具
    • OpenCV:图像处理基础库。
    • 特征提取:SIFT、SURF、ORB。
    • 深度学习:使用预训练模型(如 VGG、ResNet)提取特征。

2. 目标检测与匹配

  • 目标:检测图像中的目标,并进行匹配。
  • 工具
    • YOLO/Faster R-CNN:目标检测模型。
    • OpenCV:特征匹配(如 BFMatcher、FLANN)。

3. 图像哈希

  • 目标:通过哈希值快速比较图像。
  • 工具
    • ImageHash:计算图像的感知哈希(如 pHash、dHash)。

二、实现步骤

1. 图像相似度计算

使用 OpenCV深度学习模型 计算图像相似度。

示例代码(OpenCV + SIFT):
import cv2# 加载图像
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 初始化 SIFT 检测器
sift = cv2.SIFT_create()# 检测关键点和描述符
keypoints1, descriptors1 = sift.detectAndCompute(img1, None)
keypoints2, descriptors2 = sift.detectAndCompute(img2, None)# 使用 BFMatcher 进行匹配
bf = cv2.BFMatcher()
matches = bf.knnMatch(descriptors1, descriptors2, k=2)# 过滤匹配点
good_matches = []
for m, n in matches:if m.distance < 0.75 * n.distance:good_matches.append(m)# 计算相似度
similarity = len(good_matches) / min(len(keypoints1), len(keypoints2))
print("Similarity:", similarity)
示例代码(深度学习 + VGG):
from tensorflow.keras.applications.vgg16 import VGG16, preprocess_input
from tensorflow.keras.preprocessing import image
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np# 加载预训练模型
model = VGG16(weights='imagenet', include_top=False, pooling='avg')# 加载图像并预处理
def load_and_preprocess(img_path):img = image.load_img(img_path, target_size=(224, 224))img = image.img_to_array(img)img = np.expand_dims(img, axis=0)return preprocess_input(img)img1 = load_and_preprocess('image1.jpg')
img2 = load_and_preprocess('image2.jpg')# 提取特征
features1 = model.predict(img1).flatten()
features2 = model.predict(img2).flatten()# 计算余弦相似度
similarity = cosine_similarity([features1], [features2])[0][0]
print("Similarity:", similarity)

2. 目标检测与匹配

使用 YOLO 检测目标,并使用 OpenCV 进行匹配。

示例代码(YOLO + OpenCV):
from ultralytics import YOLO
import cv2# 加载 YOLO 模型
model = YOLO('yolov8n.pt')# 检测图像中的目标
results1 = model('image1.jpg')
results2 = model('image2.jpg')# 提取检测结果
boxes1 = results1[0].boxes.xyxy.cpu().numpy()
boxes2 = results2[0].boxes.xyxy.cpu().numpy()# 计算 IoU(交并比)
def calculate_iou(box1, box2):x1 = max(box1[0], box2[0])y1 = max(box1[1], box2[1])x2 = min(box1[2], box2[2])y2 = min(box1[3], box2[3])intersection = max(0, x2 - x1) * max(0, y2 - y1)area1 = (box1[2] - box1[0]) * (box1[3] - box1[1])area2 = (box2[2] - box2[0]) * (box2[3] - box2[1])return intersection / (area1 + area2 - intersection)# 匹配目标
for box1 in boxes1:for box2 in boxes2:iou = calculate_iou(box1, box2)if iou > 0.5:  # 设置阈值print("Matched boxes with IoU:", iou)

3. 图像哈希

使用 ImageHash 计算图像的哈希值。

示例代码(ImageHash):
from PIL import Image
import imagehash# 加载图像
hash1 = imagehash.phash(Image.open('image1.jpg'))
hash2 = imagehash.phash(Image.open('image2.jpg'))# 计算哈希距离
distance = hash1 - hash2
print("Hash distance:", distance)

三、优化建议

优化点建议
特征提取使用深度学习模型(如 VGG、ResNet)提取更高级的特征
匹配算法使用 FLANN 替代 BFMatcher,提升匹配效率
目标检测使用 YOLOv8 或 Faster R-CNN 提高检测精度
哈希算法根据需求选择 pHash(感知哈希)或 dHash(差异哈希)
硬件加速使用 GPU 加速深度学习模型推理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/905068.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C语言文件操作详解】fopen 函数全解析 —— 模式参数、使用技巧与重定向的区别

在 C 语言中&#xff0c;文件的读写是一个非常常见的需求。fopen 是标准库中提供的函数&#xff0c;用来打开文件&#xff0c;返回一个文件指针供后续操作使用。本篇博客将详细介绍 fopen 的使用方法、每个参数的含义&#xff0c;以及它与 Shell 中 >、>> 重定向符的联…

青少年编程与数学 02-019 Rust 编程基础 02课题、开始编程

青少年编程与数学 02-019 Rust 编程基础 02课题、开始编程 一、游戏规则二、实现步骤1. 创建项目2. 编写代码3. 添加依赖4. 运行程序 三、代码解析四、println! 的用法基本用法使用占位符示例控制输出宽度和精度示例 输出多个变量示例 注意事项小结 五、管理多个项目1. 创建 Wo…

拒绝flash插件打劫!如何在vscode上玩4399小游戏

现在电脑上玩4399都需要flash插件了 这也导致了很多人无法玩到小时候的游戏 今天介绍一款插件 功能强大 即安即玩 首先打开vscode 点开小方框&#xff08;拓展&#xff09;搜索4399 认准4399 on vscode点击安装 安装完毕后 按下 Ctrl Shift P , 输入 4399 on VSCode 或…

RHCSA Linux系统 Web页面 论坛 网盘的搭建

Web 服务搭建 [rootlocalhost ~]#yum install httpd -y [rootlocalhost ~]#cd /var/www/htm1/ [rootalocalhost html]#echo 江停严峫 >index.html [rootlocalhost html]#setenforce 0 #将 SELinux 模式设置为宽容模式&#xff0c;不强制执行安全策略 [rootlocalhost h…

力扣刷题——二分查找总结

我们可以总结出二分查找的通用做法和常见变种。二分查找是一种在有序数组中高效查找元素的算法&#xff0c;时间复杂度为 O (log n)。 二分查找的通用模板 二分查找的核心思想是将搜索范围不断缩小一半&#xff0c;直到找到目标元素或确定其不存在。以下是通用模板&#xff1…

开源数字人框架 AWESOME-DIGITAL-HUMAN 技术解析与应用指南

一、项目概述 AWESOME-DIGITAL-HUMAN 是一个基于 Live2D 技术的开源数字人框架&#xff0c;它集成了语音识别&#xff08;ASR&#xff09;、大语言模型&#xff08;LLM&#xff09;、语音合成&#xff08;TTS&#xff09;和 Agent 模块化扩展能力&#xff0c;支持快速部署和自…

互联网大厂Java求职面试:基于RAG的智能问答系统设计与实现-2

互联网大厂Java求职面试&#xff1a;基于RAG的智能问答系统设计与实现-2 面试背景 郑薪苦是一名Java开发者&#xff0c;拥有丰富的项目经验&#xff0c;但在面试中总喜欢用奇葩比喻解释技术问题。今天他面对的是某大厂技术总监张总&#xff0c;面试主题为“基于RAG的智能问答…

(二)Linux下基本指令 2

【知识预告】 16. date 指令 17. cal 指令 18. find 指令 19. which指令 20. whereis 指令 21. alias 指令 22. grep 指令 23. zip/unzip 指令 24. tar 指令 25. bc 指令 26. uname ‒r 指令 27. 重要的⼏个热键 28. 关机 16 date 指令 指定格式显⽰时间&#xff1a;date %Y-…

命令行解释器中shell、bash和zsh的区别

命令行解释器&#xff08;Command Line Interpreter&#xff09;是一个程序&#xff0c;它的主要作用是接收用户输入的命令&#xff0c;并执行相应的操作。它充当了用户与操作系统内核之间的桥梁。 一、什么是 Shell&#xff1f; Shell 是一个通用术语&#xff0c;指的是 命令…

二、transformers基础组件之Tokenizer

在使用神经网络处理自然语言处理任务时&#xff0c;我们首先需要对数据进行预处理&#xff0c;将数据从字符串转换为神经网络可以接受的格式&#xff0c;一般会分为如下几步: - Step1 分词:使用分词器对文本数据进行分词(字、字词);- Step2 构建词典:根据数据集分词的结果,构建…

镜像和容器的管理

一、镜像的管理 获取镜像并生成相关容器 # 拉取镜像 docker pull alpine # 默认是latest&#xff0c;也就是最新版本&#xff0c;也可指定版本&#xff08;在镜像名后边加“:版本号”&#xff09; # 或者 # 从主机中导入镜像到docker中 docker image load -i /test#生成容器 …

设计模式简述(十九)桥梁模式

桥梁模式 描述基本组件使用 描述 桥梁模式是一种相对简单的模式&#xff0c;通常以组合替代继承的方式实现。 从设计原则来讲&#xff0c;可以说是单一职责的一种体现。 将原本在一个类中的功能&#xff0c;按更细的粒度拆分到不同的类中&#xff0c;然后各自独立发展。 基本…

ImportError: DLL load failed: 找不到指定的程序。

查看其他博客说是缺少libssl-1_1-x64.dll 和 libcrypto-1_1-x64.dll 然后去下载放到博客说的目录下 没有用 解决不了一点 OpenSSL for Windows 64位 完整安装包 在这里 项目地址: https://gitcode.com/open-source-toolkit/eb627 注意事项 此安装包仅适用于64位Windows系…

电池单元和电极性能

电芯设计中的挑战 对于电池制造商来说&#xff0c;提高电池能量和功率密度至关重要。在高功率密度和长循环寿命之间取得平衡是电池设计中的关键挑战&#xff0c;通常需要仔细优化材料、电极结构和热管理系统。另一个关键挑战是通过优化重量体积比来降低电池单元的总体成本。 工…

数据加密与隐私保护:让你的信息固若金汤

数据加密与隐私保护:让你的信息固若金汤 大家好,我是 Echo_Wish,今天聊聊一个 人人都关心、但很多人没做好 的话题——数据加密与隐私保护的最佳实践。 为什么要重视数据安全? 现在是数字化时代,从个人照片、银行卡信息到企业机密,数据泄露的风险无处不在。你可能觉得自…

【高数上册笔记篇02】:数列与函数极限

【参考资料】 同济大学《高等数学》教材樊顺厚老师B站《高等数学精讲》系列课程 &#xff08;注&#xff1a;本笔记为个人数学复习资料&#xff0c;旨在通过系统化整理替代厚重教材&#xff0c;便于随时查阅与巩固知识要点&#xff09; 仅用于个人数学复习&#xff0c;因为课…

C++(8):类型限定符

目录 1. const&#xff1a;定义常量 2. volatile&#xff1a;易变性修饰 3. restrict&#xff08;C非标准&#xff09; 4. mutable&#xff1a;突破常量性 5. static&#xff1a;静态存储 6. register&#xff08;已弃用&#xff09; 分类修正说明 1. const&#xff1a;…

Nginx yum 安装

一、环境准备 一台装有 CentOS 7.9 的虚拟机 二、安装 安装 yum install -y nginx -y&#xff1a;所有的安装选项都选择 yes。 启动 nginx systemctl enable nginx --now enable&#xff1a;设置 nginx 为开机启动。--now&#xff1a;马上启动 nginx。 查看 nginx 服务状态…

【5分钟学Docker】Docker快速使用

目录 1. 概述 2. 基本操作 2.1. 镜像操作 2.2. 容器操作 2.3. 运行操作 2.4. 镜像保存 2.5. 镜像分享 3. 高级操作 4. 挂载 4.1. 目录挂载 4.2. 卷映射 1. 概述 Docker 镜像有镜像名称和TAG 2. 基本操作 2.1. 镜像操作 查看镜像 docker images docker image ls …

5000字总结 HTML5 中的音频和视频,关羽标签、属性、API 和最佳实践

HTML5 音频与视频开发完全指南&#xff1a;标签、属性、API 与最佳实践 一、引言&#xff1a;HTML5 媒体时代的到来 在 HTML5 之前&#xff0c;网页中的音频和视频播放依赖 Flash、Silverlight 等第三方插件&#xff0c;存在兼容性差、性能瓶颈和安全隐患。HTML5 引入的 <…