基于深度学习的肾结石检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

news/2025/12/16 16:17:28/文章来源:https://www.cnblogs.com/codingtea/p/19357871

视频演示

基于深度学习的肾结石检测系统演示

1. 前言​

大家好,欢迎来到「Coding茶水间」!

在日常医学影像工作中,肾结石的筛查往往需要医生仔细阅片,不仅耗时,还容易受到主观因素影响。为了让这一过程更高效、更客观,我们基于当前热门的 YOLO 目标检测算法,开发了一套 肾结石检测系统。这套系统能够自动分析肾脏影像,快速判断其中是否存在肾结石,并标出位置和置信度,支持图片、视频、文件夹批量以及摄像头实时检测。

除了核心检测功能,我们还设计了直观的图形界面,方便操作和查看结果,同时加入了用户登录、脚本化检测和模型训练模块,让它不仅适合演示,也能用于实际项目或科研实验。

本期内容将带大家快速了解这套系统的功能与使用方法,看看 AI 如何在医学影像领域帮我们“看片子”、提效率。

2. 项目演示

2.1 用户登录界面

登录界面布局简洁清晰,左侧展示系统主题,用户需输入用户名、密码及验证码完成身份验证后登录系统。

3

2.2 新用户注册

注册时可自定义用户名与密码,支持上传个人头像;如未上传,系统将自动使用默认头像完成账号创建。

ScreenShot_2025-12-16_150904_318

2.3 主界面布局

主界面采用三栏结构,左侧为功能操作区,中间用于展示检测画面,右侧呈现目标详细信息,布局合理,交互流畅。

2

2.4 个人信息管理

用户可在此模块中修改密码或更换头像,个人信息支持随时更新与保存。

ScreenShot_2025-12-16_151009_404

2.5 多模态检测展示

系统支持图片、视频及摄像头实时画面的目标检测。识别结果将在画面中标注显示,并在下方列表中逐项列出。点击具体目标可查看其类别、置信度及位置坐标等详细信息。

1

2.6 多模型切换

系统内置多种已训练模型,用户可根据实际需求灵活切换,以适应不同检测场景或对比识别效果。

ScreenShot_2025-12-16_151022_307

3.模型训练核心代码

本脚本是YOLO模型批量训练工具,可自动修正数据集路径为绝对路径,从pretrained文件夹加载预训练模型,按设定参数(100轮/640尺寸/批次8)一键批量训练YOLOv5nu/v8n/v11n/v12n模型。

# -*- coding: utf-8 -*-
"""
该脚本用于执行YOLO模型的训练。它会自动处理以下任务:
1. 动态修改数据集配置文件 (data.yaml),将相对路径更新为绝对路径,以确保训练时能正确找到数据。
2. 从 'pretrained' 文件夹加载指定的预训练模型。
3. 使用预设的参数(如epochs, imgsz, batch)启动训练过程。要开始训练,只需直接运行此脚本。
"""
import os
import yaml
from pathlib import Path
from ultralytics import YOLOdef main():"""主训练函数。该函数负责执行YOLO模型的训练流程,包括:1. 配置预训练模型。2. 动态修改数据集的YAML配置文件,确保路径为绝对路径。3. 加载预训练模型。4. 使用指定参数开始训练。"""# --- 1. 配置模型和路径 ---# 要训练的模型列表models_to_train = [{'name': 'yolov5nu.pt', 'train_name': 'train_yolov5nu'},{'name': 'yolov8n.pt', 'train_name': 'train_yolov8n'},{'name': 'yolo11n.pt', 'train_name': 'train_yolo11n'},{'name': 'yolo12n.pt', 'train_name': 'train_yolo12n'}]# 获取当前工作目录的绝对路径,以避免相对路径带来的问题current_dir = os.path.abspath(os.getcwd())# --- 2. 动态配置数据集YAML文件 ---# 构建数据集yaml文件的绝对路径data_yaml_path = os.path.join(current_dir, 'train_data', 'data.yaml')# 读取原始yaml文件内容with open(data_yaml_path, 'r', encoding='utf-8') as f:data_config = yaml.safe_load(f)# 将yaml文件中的 'path' 字段修改为数据集目录的绝对路径# 这是为了确保ultralytics库能正确定位到训练、验证和测试集data_config['path'] = os.path.join(current_dir, 'train_data')# 将修改后的配置写回yaml文件with open(data_yaml_path, 'w', encoding='utf-8') as f:yaml.dump(data_config, f, default_flow_style=False, allow_unicode=True)# --- 3. 循环训练每个模型 ---for model_info in models_to_train:model_name = model_info['name']train_name = model_info['train_name']print(f"\n{'='*60}")print(f"开始训练模型: {model_name}")print(f"训练名称: {train_name}")print(f"{'='*60}")# 构建预训练模型的完整路径pretrained_model_path = os.path.join(current_dir, 'pretrained', model_name)if not os.path.exists(pretrained_model_path):print(f"警告: 预训练模型文件不存在: {pretrained_model_path}")print(f"跳过模型 {model_name} 的训练")continuetry:# 加载指定的预训练模型model = YOLO(pretrained_model_path)# --- 4. 开始训练 ---print(f"开始训练 {model_name}...")# 调用train方法开始训练model.train(data=data_yaml_path,  # 数据集配置文件epochs=100,           # 训练轮次imgsz=640,            # 输入图像尺寸batch=8,             # 每批次的图像数量name=train_name,      # 模型名称)print(f"{model_name} 训练完成!")except Exception as e:print(f"训练 {model_name} 时出现错误: {str(e)}")print(f"跳过模型 {model_name},继续训练下一个模型")continueprint(f"\n{'='*60}")print("所有模型训练完成!")print(f"{'='*60}")if __name__ == "__main__":# 当该脚本被直接执行时,调用main函数main()

4. 技术栈

  • 语言:Python 3.10

  • 前端界面:PyQt5

  • 数据库:SQLite(存储用户信息)

  • 模型:YOLOv5、YOLOv8、YOLOv11、YOLOv12

5. YOLO模型对比与识别效果解析

5.1 YOLOv5/YOLOv8/YOLOv11/YOLOv12模型对比

基于Ultralytics官方COCO数据集训练结果:

模型

尺寸(像素)

mAPval 50-95

速度(CPU ONNX/毫秒)

参数(M)

FLOPs(B)

YOLO12n

640

40.6

-

2.6

6.5

YOLO11n

640

39.5

56.1 ± 0.8

2.6

6.5

YOLOv8n

640

37.3

80.4

3.2

8.7

YOLOv5nu

640

34.3

73.6

2.6

7.7

关键结论

  1. 精度最高:YOLO12n(mAP 40.6%),显著领先其他模型(较YOLOv5nu高约6.3个百分点);

  2. 速度最优:YOLO11n(CPU推理56.1ms),比YOLOv8n快42%,适合实时轻量部署;

  3. 效率均衡:YOLO12n/YOLO11n/YOLOv8n/YOLOv5nu参数量均为2.6M,FLOPs较低(YOLO12n/11n仅6.5B);YOLOv8n参数量(3.2M)与计算量(8.7B)最高,但精度优势不明显。

综合推荐

  • 追求高精度:优先选YOLO12n(精度与效率兼顾);

  • 需高速低耗:选YOLO11n(速度最快且精度接近YOLO12n);

  • YOLOv5nu/YOLOv8n因性能劣势,无特殊需求时不建议首选。

5.2 数据集分析

labels

数据集中训练集和验证集一共17000张图片,数据集目标类别两种:正常肾脏,肾结石数据集配置代码如下:

names:
- kidney-stone
- normal kidney
nc: 2
path: D:\project\python\yolo_Kidney_Stone_Detection\train_data
test: ../test/images
train: ../train/images
val: ../valid/images

 train_batch0

train_batch1

上面的图片就是部分样本集训练中经过数据增强后的效果标注。

5.3 训练结果

confusion_matrix_normalized

混淆矩阵显示中识别精准度显示是一条对角线,方块颜色越深代表对应的类别识别的精准度越高

BoxF1_curve

F1指数(F1 Score)是统计学和机器学习中用于评估分类模型性能的核心指标,综合了模型的精确率(Precision)和召回率(Recall),通过调和平均数平衡两者的表现。 

当置信度为0.426时,所有类别的综合F1值达到了0.86(蓝色曲线)。

BoxPR_curve

mAP@0.5:是目标检测任务中常用的评估指标,表示在交并比(IoU)阈值为0.5时计算的平均精度均值(mAP)。其核心含义是:只有当预测框与真实框的重叠面积(IoU)≥50%时,才认为检测结果正确。

图中可以看到综合mAP@0.5达到了0.900(90.0%),准确率非常高。

6. 源码获取方式

源码获取方式:https://www.bilibili.com/video/BV11oUBBBEuf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1025554.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

148 个 Excel 函数该不该背?AI Excel 给了我另一种答案

你可能背过 Excel 函数、抄过公式、收藏过无数教程。 但真正工作时,依然会卡在: VLOOKUP 又写错参数 COUNTIF / SUMIFS 条件一多就乱 IF 嵌 IF,自己都看不懂 很多人以为,这是自己 Excel 不熟、学得不够。 但事实上&#xff…

YOLOv8深度解析:为什么它成为大模型微调新宠?

YOLOv8深度解析:为什么它成为大模型微调新宠? 在智能摄像头遍布工厂车间、自动驾驶车辆穿梭于城市街道的今天,一个共同的技术挑战摆在面前:如何让机器“看”得又快又准?尤其是在边缘设备资源受限、云端推理成本敏感的背…

从零开始配置PaddlePaddle开发环境:ubuntu安装+cuda安装一站式教程

从零开始配置PaddlePaddle开发环境:Ubuntu安装CUDA安装一站式教程 在深度学习项目启动的第一天,很多开发者都会遇到一个看似简单却极易“踩坑”的问题:如何让PaddlePaddle真正跑在GPU上?明明装了CUDA、也装了paddlepaddle-gpu&am…

Ubuntu20.04安装TensorFlow/PyTorch GPU及开发环境

Ubuntu 20.04 搭建 GPU 加速深度学习开发环境 在当今 AI 研发的日常中,本地训练环境的搭建依然是许多工程师和研究者绕不开的第一步。尤其是在使用 PyTorch 或 TensorFlow 进行模型训练时,能否顺利启用 GPU 加速,往往直接决定了开发效率的高…

Mysql入湖Iceberg

Mysql入湖Iceberg 使用Scala实现Spark高可用集群读取Mysql数据写入Iceberg数据湖,数据存储于Hadoop高可用集群 Spark 3.3.3Hadoop 3.3.6Iceberg 1.3.0 代码 package com.czl.datalake.template.iceberg.mysqlimport org.apache.spark.sql.SparkSessionobject Test {…

基于PyTorch-CUDA容器的PM2.5浓度预测实战

基于PyTorch-CUDA容器的PM2.5浓度预测实战 当城市被灰蒙的空气笼罩,人们不再只关心“今天有没有雾霾”,而是迫切地追问:未来12小时,孩子上学路上的空气质量安全吗? 这已不再是靠肉眼判断或收听天气预报就能回答的问题…

LobeChat能否实现SQL注入检测?安全编码辅助工具

LobeChat能否实现SQL注入检测?安全编码辅助工具 在现代Web应用开发中,一个看似普通的用户查询接口,可能正悄悄打开通往数据库的后门。比如这行代码: db.query(SELECT * FROM users WHERE id ${req.query.id})它简洁、直观&…

2025防伪溯源服务商TOP5权威测评:北京信飞智创市场口碑 - myqiye

在消费升级与市场监管趋严的双重背景下,企业对防伪溯源、渠道管控的需求呈爆发式增长。据2024年行业报告显示,国内一物一码市场规模突破360亿元,年增速达38%,但超60%的企业仍面临假货泛滥、窜货乱价、营销低效三大…

TensorFlow-GPU 2.5安装全流程指南

TensorFlow-GPU 2.5安装全流程指南 在深度学习项目中,训练速度往往是决定开发效率的关键。当你面对一个需要数小时才能跑完的模型时,有没有想过——仅仅通过正确配置 GPU 支持,就能将时间压缩到几十分钟?这正是 TensorFlow-GPU 的…

SGLang部署Qwen3-32B本地大模型实战

SGLang部署Qwen3-32B本地大模型实战 在企业对数据隐私和合规性要求日益严格的今天,把敏感信息留在本地、实现“数据不出库”,已经不再是可选项,而是硬性前提。与此同时,AI应用却在向更复杂、更深思熟虑的方向演进——我们需要的不…

PyTorch安装后无法导入YOLO?原因在这里

PyTorch安装后无法导入YOLO?原因在这里 在智能视觉系统开发中,一个看似简单的问题却频繁困扰着新手甚至部分有经验的开发者:明明已经用 pip install torch 成功装好了 PyTorch,为什么一运行 import yolov5 或 from ultralytics i…

LobeChat能否用于构建心理咨询机器人?伦理边界讨论

LobeChat能否用于构建心理咨询机器人?伦理边界讨论 在数字时代,心理健康服务正面临一场深刻的变革。全球范围内心理咨询资源严重不足,而需求却持续攀升——尤其是在疫情后社会,焦虑、抑郁等情绪问题愈发普遍。与此同时&#xff0c…

LobeChat能否背单词?语言学习新模式

LobeChat能否背单词?语言学习新模式 在智能教育工具日益同质化的今天,一个值得思考的问题浮现出来:我们是否真的需要又一款“点一下显示释义”的背单词APP?当记忆卡片的形式十几年未曾改变,而大语言模型已经能写诗、编…

2025年12月数字人厂商综合实力榜单发布,揭示数字人企业三大演进方向 - 博客万

2025 年 12 月,国内权威机构联合行业协会发布《2025 年中国数字人企业厂商综合竞争力排名榜》,榜单基于技术实力、场景落地、商业价值、生态布局四大核心维度,对全国数千家数字人相关企业进行全面评估。结果显示,数…

Qwen-Image-Edit-2509本地部署与智能图像编辑指南

Qwen-Image-Edit-2509本地部署与智能图像编辑指南 你有没有经历过这样的场景:市场部临时通知,“所有产品图的LOGO必须今晚全部换成新版,明天一早上线”,而设计师早已下班?又或者,运营需要为春节、情人节、6…

2025Deepseek知识库建设方案商部署优选清单:企业知识库部署厂商全收录 - 品牌2026

“Deepseek知识库建设方案商”这个词最近很火,说白了就是:把最火的大模型Deepseek装进自家机房,让知识库只给自家员工用,数据不飘在云端。2025年新规越来越严,金融、医疗、制造都在找能把大模型“搬回家”的帮手。…

LobeChat能否进入元宇宙?三维空间交互设想

LobeChat 能否进入元宇宙?三维空间交互的工程设想 在 VR 展厅中,你戴上头显步入一个未来城市模型。突然,角落里一位虚拟助手转过身来:“需要我带你参观吗?”你点头,它便开始讲解建筑结构、能耗数据&#xf…

重磅!原中科院2区TOP期刊,因学术造假,被踢出SCI!

重磅!12月WOS目录更新,SCI/SSCI/AHCI目录共3本期刊发生变动,其中On Hold长达14个月的中科院2区期刊《JOURNAL OF MOLECULAR LIQUIDS》在最终评估后被SCI数据库剔除!ESCI目录共78本期刊发生变动,此前3本被On Hold的ESCI…

代码重构艺术的技术文章大纲

什么是代码重构定义代码重构及其核心目标 重构与重写的区别 重构的常见场景(技术债、性能优化、可维护性提升)重构的基本原则www.yunshengzx.com保持功能不变性 小步修改与频繁测试 遵循SOLID原则 利用设计模式优化结构常见的重构技术重命名变量/方法&am…

力扣701 二叉搜索树中的插入操作 java实现

701.二叉搜索树中的插入操作给定二叉搜索树(BST)的根节点 root 和要插入树中的值 value ,将值插入二叉搜索树。 返回插入后二叉搜索树的根节点。 输入数据 保证 ,新值和原始二叉搜索树中的任意节点值都不同。注意,可能…