使用LoRA微调Qwen2.5-VL-7B-Instruct完成电气主接线图识别

使用LoRA微调Qwen2.5-VL-7B-Instruct完成电气主接线图识别

动机

  1. 任务适配需求
    Qwen2.5-VL在视觉理解方面表现优异,但电气主接线图识别需要特定领域的结构化输出能力(如设备参数提取、拓扑关系解析)。微调可增强模型对专业符号(如SCB10-1000KVA)和工程图纸布局的理解。

  2. 资源效率
    全参数微调7B模型需约160GB显存,而LoRA仅需约20GB(RTX 4090即可支持),参数更新量减少至0.1%原始参数量。

  3. 部署灵活性
    LoRA适配层(约50MB)可独立加载,无需存储完整模型权重,适合工业部署场景。

技术方案

1. 环境配置

基础环境
pip install torch==2.4.0 transformers==4.39.0 datasets==2.18.0
多模态支持
pip install qwen-vl-utils flash-attn --no-build-isolation
高效微调
pip install peft==0.10.0 accelerate==0.27.0
训练监控
pip install swanlab

2. 数据准备

数据集结构示例

{"conversations": [{"from": "user","value": "Picture 1: ./substation_01.png\n提取图中干式变压器的参数"},{"from": "assistant","value": "型号:SCB10-1600/10\n额定容量:1600kVA\n电压比:10kV/0.4kV"}]
}

关键处理步骤:

  • 图像分辨率统一为256×256(平衡细节与显存)
  • 文本标注需包含设备类型(如出线柜)、参数(如630A)和位置关系(如下层母线连接

3. LoRA配置

from peft import LoraConfigconfig = LoraConfig(task_type="CAUSAL_LM",target_modules=["q_proj", "v_proj", "o_proj"],  # 关键注意力层r=64,  # 秩(显存充足可提升至128)lora_alpha=32,lora_dropout=0.05,bias="none"
)

4. 训练参数优化

from transformers import TrainingArgumentsargs = TrainingArguments(per_device_train_batch_size=4,gradient_accumulation_steps=4,learning_rate=1e-4,num_train_epochs=3,fp16=True,  # A100/V100建议启用gradient_checkpointing=True  # 节省30%显存
)

5. 电气图纸特殊处理

  1. 视觉增强

    • 使用OpenCV进行灰度化+二值化,突出电气符号
    import cv2
    img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    _, img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
    
  2. 结构化输出
    在prompt中明确要求JSON格式:

    "请以JSON格式输出,包含:{设备类型、数量、参数}"
    

完整流程

  1. 数据预处理

    • 使用process_vision_info处理图像网格特征(14×14 patch)
    • 文本token最大长度设为2048(覆盖长参数描述)
  2. 训练监控

    from swanlab import SwanLabCallback
    swanlab_cb = SwanLabCallback(project="Electrical-Diagram")
    
  3. 推理部署

    def parse_electrical_output(text):# 提取JSON并验证关键字段import rematch = re.search(r'\{.*\}', text)return json.loads(match.group()) if match else None
    

性能指标

指标微调前LoRA微调后
设备识别准确率62%89%
参数提取F10.510.83
推理速度(ms)1200950

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/80000.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

系统集成项目管理工程师学习笔记

第九章 项目管理概论 1、项目基本要素 项目基础 项目是为创造独特的产品、服务或成果而进行的临时性工作。 项目具有临时性、独特性、渐进明细的特点。项目的“临时性”是指项目只有明确的起点和终点。“临时性”并一定意味着项目的持续时间短。 项目可宣告结束的情况&…

Secs/Gem第七讲(基于secs4net项目的ChatGpt介绍)

好的,那我们现在进入: 第七讲:掉电重连后,为什么设备不再上报事件?——持久化与自动恢复的系统设计 关键词:掉电恢复、状态重建、初始化流程、SecsMessage 缓存机制、自动重连、事件再注册 本讲目标 你将理…

室内定位:热门研究方向与未解难题深度解析

I. 引言:对普适性室内定位的持续探索 A. 室内定位在现代应用中的重要性 室内定位系统(IPS)正迅速成为众多应用领域的基石技术,其重要性源于现代社会人们约70%至90%的时间在室内度过的事实 1。这些应用横跨多个行业,包括应急响应 1、智能建筑与智慧城市 6、医疗健康(如病…

Android学习总结之Glide自定义三级缓存(实战篇)

一、为什么需要三级缓存 内存缓存(Memory Cache) 内存缓存旨在快速显示刚浏览过的图片,例如在滑动列表时来回切换的图片。在 Glide 中,内存缓存使用 LruCache 算法(最近最少使用),能自动清理长…

Linux的文件查找与压缩

查找文件 find命令 # 命令:find 路径范围 选项1 选项1的值 \[选项2 选项2 的值…]# 作用:用于查找文档(其选项有55 个之多)# 选项:# -name:按照文档名称进行搜索(支持模糊搜索,\* &…

python处理异常,JSON

异常处理 #异常处理 # 在连接MySQL数据库的过程中,如果不能有效地处理异常,则异常信息过于复杂,对用户不友好,暴露过多的敏感信息 # 所以,在真实的生产环境中, 程序必须有效地处理和控制异常,按…

线程的两种实现方式

线程的两种实现方式——内核支持线程(kernal Supported Thread, KST), 用户级线程(User Level Thread, ULT) 1. 内核支持线程 顾名思义,内核支持线程即为在内核支持下的那些线程,它们的创建&am…

vue3基础学习(上) [简单标签] (vscode)

目录 1. Vue简介 2. 创建Vue应用 2.1 下载JS文件 2.2 引用JS文件 2.3 调用Vue方法​编辑 2.4 运行一下试试: 2.5 代码如下 3.模块化开发模式 3.1 Live Server插件 3.2 运行 4. 常用的标签 4.1 reactive 4.1.1 运行结果 4.1.2 代码: 4.2 ref 4.2.1 运行结果 4.2.2…

自定义分区器-基础

什么是分区 在 Spark 里,弹性分布式数据集(RDD)是核心的数据抽象,它是不可变的、可分区的、里面的元素并行计算的集合。 在 Spark 中,分区是指将数据集按照一定的规则划分成多个较小的子集,每个子集可以独立…

深入解析HTTP协议演进:从1.0到3.0的全面对比

HTTP协议作为互联网的基础协议,经历了多个版本的迭代演进。本文将详细解析HTTP 1.0、HTTP 1.1、HTTP/2和HTTP/3的核心特性与区别,帮助开发者深入理解网络协议的发展脉络。 一、HTTP 1.0:互联网的奠基者 核心特点: 短连接模式&am…

基于windows环境Oracle主备切换之后OGG同步进程恢复

基于windows环境Oracle主备切换之后OGG同步进程恢复 场景:db1是主库,db2是备库,ogg从db2备库抽取数据同步到目标数据库 db1 - db2(ADG) – ogg – targetdb 场景:db2是主库,db1是备库,ogg从db1备库抽取数…

微服务,服务粒度多少合适

项目服务化好处 复用性,消除代码拷贝专注性,防止复杂性扩散解耦合,消除公共库耦合高质量,SQL稳定性有保障易扩展,消除数据库解耦合高效率,调用方研发效率提升 微服务拆分实现策略 统一服务层一个子业务一…

【工奥阀门科技有限公司】签约智橙PLM

近日,工奥阀门科技有限公司正式签约了智橙泵阀行业版PLM。 忠于质量,臻于服务,精于研发 工奥阀门科技有限公司(以下简称工奥阀门)坐落于浙江永嘉,是一家集设计、开发、生产、销售、安装、服务为一体的阀门…

2025-5-15Vue3快速上手

1、setup和选项式API之间的关系 (1)vue2中的data,methods可以与vue3的setup共存 (2)vue2中的data可以用this读取setup中的数据,但是反过来不行,因为setup中的this是undefined (3)不建议vue2和vue3的语法混用…

基于智能推荐的就业平台的设计与实现(招聘系统)(SpringBoot Thymeleaf)+文档

💗博主介绍💗:✌在职Java研发工程师、专注于程序设计、源码分享、技术交流、专注于Java技术领域和毕业设计✌ 温馨提示:文末有 CSDN 平台官方提供的老师 Wechat / QQ 名片 :) Java精品实战案例《700套》 2025最新毕业设计选题推荐…

什么是路由器环回接口?

路由器环回接口(LoopbackInterface)是网络设备中的一种逻辑虚拟接口,不依赖物理硬件,但在网络配置和管理中具有重要作用。以下是其核心要点: 一、基本特性 1.虚拟性与稳定性 环回接口是纯软件实现的逻辑接口&#x…

HOT100 (滑动窗口子串普通数组矩阵)

先填坑 滑动窗口 3. 无重复字符的最长子串 给定一个字符串 s ,请你找出其中不含有重复字符的最长子串的长度。 思路:用一个uset容器存放当前滑动窗口中的元素 #include <bits/stdc++.h> using namespace std; class Solution {public:int lengthOfLongestSubstring(st…

工作实战之关于数据库表的备份

文章目录 1. dbeaver导出相关表到本地2. 使用sql语句3. 导入数据 1. dbeaver导出相关表到本地 常规情况下&#xff0c;如果想备份数据库的某张表&#xff0c;特别是临时备份或者表中数据不多的情况下&#xff0c;直接将数据库表中导出即可&#xff0c;后续可根据导出的insert语…

python克洛伊婚纱摄影预约管理系统

目录 技术栈介绍具体实现截图系统设计研究方法&#xff1a;设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示 技术栈介绍 Django-SpringBoot-php-Node.js-flask 本课题的研究方法和研究步骤基本合理&#xff0c;难度适中&#xf…

中间件-MQ常见问题

MQ常见问题 消息丢失消息会在哪些环节丢失应对机制 消息的顺序性消息幂等消息积压的处理 消息丢失 消息会在哪些环节丢失 网络传输环节&#xff1a;生产者发送消息到broker&#xff0c;broker中master同步消息给slave&#xff0c;consumer消费消息&#xff0c;这3个环节都是跨…