如何冻结llava的参数，在训练时不动

如何冻结llava的参数，在训练时不动

news/2025/11/7 3:12:19/文章来源:https://www.cnblogs.com/zzai/p/19198200

思路很简单：把 LLaVA 的所有参数 requires_grad=False，只训练你自己的模块（比如 mask 头）。下面给出几种常见写法，任选其一。

冻结整个 LLaVA（vision + projector + language model）

def freeze_llava(llava):for p in llava.parameters():p.requires_grad = False# 你的封装里（以 XVQAModel 为例）
model = XVQAModel(llava_model=llava, ...)
freeze_llava(model.llava)# 只把需要训练的模块交给优化器（例如 mask 头）
optimizer = torch.optim.AdamW(params=[p for p in model.mask_head_deocder.parameters() if p.requires_grad],lr=1e-4
)

记得优化器只传入可训练参数，否则会把被冻结的也塞进去（虽然不会更新，但浪费时间/显存）。

选择性冻结（只留 projector 或某些层可训）

只训练 mm_projector（常见微调方式）：

def freeze_all_but_projector(llava):for p in llava.parameters():p.requires_grad = Falsefor p in llava.mm_projector.parameters():p.requires_grad = Truefreeze_all_but_projector(model.llava)
optimizer = torch.optim.AdamW(list(model.mask_head_deocder.parameters()) + list(model.llava.mm_projector.parameters()),lr=1e-4
)

只训练语言模型最后 N 层（举例 N=2）：

def freeze_all_but_last_n_transformer_blocks(llava, n=2):for p in llava.parameters():p.requires_grad = False# LLaVA 的 LLM 一般在 llava.model.layersfor blk in llava.model.layers[-n:]:for p in blk.parameters():p.requires_grad = Truefreeze_all_but_last_n_transformer_blocks(model.llava, n=2)

只训练视觉塔（不常见）：

def freeze_all_but_vision(llava):for p in llava.parameters():p.requires_grad = Falsefor p in llava.vision_tower.parameters():p.requires_grad = True

冻结后的小检查

def count_trainable_params(m):return sum(p.numel() for p in m.parameters() if p.requires_grad)print("trainable in XVQAModel:", count_trainable_params(model))
print("trainable in LLaVA:", count_trainable_params(model.llava))
print("trainable in mask head:", count_trainable_params(model.mask_head_deocder))

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/958251.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

解决CentOS 7中NAT模式无法连接网络

解决CentOS 7中NAT模式无法连接网络

进入文件夹 cd /etc/sysconfig/network-scripts/ 修改配置文件 vi ifcfg-ens33(按你的命名来) 文件配置方法如下记住NAT模式下的子网ip,即图中左下192.168.72.0（以你的为准）点击DHCP设置，记住启始IP，结束IP地址，…

阅读更多...

Linux 音频管道测试

Linux 音频管道测试

方案1：使用现有的工具进行WAV音频传输这是最简单直接的方法，使用系统自带工具。 1. 创建命名管道bash 复制下载mkfifo /tmp/audio_fifo2. 启动消费者（在一个终端中）播放来自管道的原始音频数据：bash 复制下载a…

阅读更多...

课程评价

课程评价

之前看了很多人的课程评价（比如 xzy)，现在突然想写一个了一个很主观的评价，大致按喜好程度排序预科上几乎没参考价值，预科上太摆了，对什么课都提不起兴趣计算机科学基础 by 陈渝感觉谈不上喜欢，听了几次就没…

阅读更多...

2025 年 11 月微通道换热器厂家推荐排行榜，微通道蒸发器，微通道换热器，高效换热解决方案专业制造商

2025 年 11 月微通道换热器厂家推荐排行榜，微通道蒸发器，微通道换热器，高效换热解决方案专业制造商

2025 年 11 月微通道换热器厂家推荐排行榜，微通道蒸发器，微通道换热器，高效换热解决方案专业制造商在工业与汽车制冷领域，微通道换热技术凭借其高效传热性能、紧凑结构和环保特性，正逐步成为热交换系统的主流选择…

阅读更多...

2025 年 11 月冷库板/聚氨酯冷库板/机制板, 冷库门, 冷库工程/冷库集成厂家推荐排行榜，专业定制与高效保温解决方案精选

2025 年 11 月冷库板/聚氨酯冷库板/机制板, 冷库门, 冷库工程/冷库集成厂家推荐排行榜，专业定制与高效保温解决方案精选

2025年11月冷库板/聚氨酯冷库板/机制板, 冷库门, 冷库工程/冷库集成厂家推荐排行榜，专业定制与高效保温解决方案精选一、行业背景与发展趋势冷链物流作为现代物流体系的重要组成部分，在食品安全、医药保障和生鲜供应…

阅读更多...

2025 年 11 月冷库板/聚氨酯冷库板/机制板, 冷库门, 冷库工程/冷库集成厂家推荐排行榜：专业制造与高效保温系统解决方案

2025 年 11 月冷库板/聚氨酯冷库板/机制板, 冷库门, 冷库工程/冷库集成厂家推荐排行榜：专业制造与高效保温系统解决方案

2025 年 11 月冷库板/聚氨酯冷库板/机制板, 冷库门, 冷库工程/冷库集成厂家推荐排行榜：专业制造与高效保温系统解决方案一、行业背景与发展趋势随着冷链物流行业的快速发展，冷库作为冷链体系的核心基础设施，其建设质…

阅读更多...

Codeforces Global Round 30 (Div. 1 + Div. 2)

Codeforces Global Round 30 (Div. 1 + Div. 2)

A. Sequence Game 题意：一个数组\(a\)，每次选择两个相邻的数，用它们之间的一个值替换它们两个。求最后能不能使得留下的数是\(x\)。如果\(\min(a) \leq x \leq \max(a)\)则可行。最小值和最大值和别人操作时可以留…

阅读更多...

价值权衡的完整计算模型：价值体系与规则体系的辩证统一

价值权衡的完整计算模型：价值体系与规则体系的辩证统一

价值权衡的完整计算模型：价值体系与规则体系的辩证统一摘要：本文提出一个面向人工智能价值权衡的完整计算模型，旨在解决传统"价值对齐"范式的理论局限。该模型以"共识原语"为基本单元，通过&q…

阅读更多...

试试用 MiniMax Agent 做一个介绍 JSON 格式化网站的页面

试试用 MiniMax Agent 做一个介绍 JSON 格式化网站的页面

试试用 MiniMax Agent 做一个介绍 JSON 格式化网站的页面今天尝试用 MiniMax Agent 做了一个简单的网页，效果看起来还不错：JSON Formatter Online - 专业的在线JSON格式化工具具体使用的对话内容可以直接看这里：ht…

阅读更多...

【esp32 学习笔记】采用 millis() 函数的非阻塞循环的写法

【esp32 学习笔记】采用 millis() 函数的非阻塞循环的写法

在ESP32的循环中，为了避免使用 delay(100) 等阻塞循环，经常采用以下三段式的写法： void loop() {audio.loop(); // 必须频繁调用unsigned long currentMillis = millis();// 使用millis()检查是否到了执行时间，而不…

阅读更多...

USSD 代码

USSD 代码

简介 USSD（Unstructured Supplementary Service Data，非结构化补充业务数据）是 GSM 网络提供的一种实时交互式命令通道。形式：以 * 和 # 组成，如 *#06#、*#100#、*123#。通信方式：与运营商核心网直接交互，非短…

阅读更多...

【ESP32 进阶】非阻塞循环的写法

【ESP32 进阶】非阻塞循环的写法

在ESP32的循环中，为了避免使用 delay(100) 等阻塞循环，经常采用以下三段式的写法： void loop() {audio.loop(); // 必须频繁调用unsigned long currentMillis = millis();// 使用millis()检查是否到了执行时间，而不…

阅读更多...

2025年11月脸部泛红产品推荐榜：泛红舒缓精华实测排名

2025年11月脸部泛红产品推荐榜：泛红舒缓精华实测排名

换季、熬夜、频繁刷酸或长期佩戴口罩，都会让屏障脆弱的脸颊出现“红绿灯式”泛红，伴随灼热、刺痒甚至脱屑。对敏感肌人群而言，选错产品可能让刺激叠加，选对产品则能在数分钟内把不适感“压下去”，并持续加固屏障。…

阅读更多...

2025年11月脸部泛红产品推荐榜：屏障修护精华对比榜单

2025年11月脸部泛红产品推荐榜：屏障修护精华对比榜单

换季、熬夜、刷酸、频繁戴口罩，都让“脸一热就红”成为越来越多人的日常。后台留言里，高频出现的词是“泛红反复”“护肤品越用越刺激”“想遮又遮不住”。泛红不仅是外观困扰，更伴随灼热、紧绷、瘙痒，影响工作社交…

阅读更多...

2025年11月进度管理工具评价榜：行业数据与用户反馈全解析

2025年11月进度管理工具评价榜：行业数据与用户反馈全解析

在当今快节奏的工作环境中，进度管理工具已成为企业提升效率的关键支撑。随着远程办公模式的普及和项目复杂度的提升，越来越多的团队管理者、项目经理以及个人工作者开始寻求专业的进度管理解决方案。这类用户通常面临…

阅读更多...

2025年11月北京房产纠纷律师排名分析：客观评价与实务参考

2025年11月北京房产纠纷律师排名分析：客观评价与实务参考

在北京这座超一线城市，房产纠纷往往涉及重大利益且法律关系复杂。选择一位专业对口的律师成为许多当事人的迫切需求。根据行业白皮书显示，北京房产纠纷案件年增长率持续保持在10%以上，案件类型涵盖商品房买卖、遗产…

阅读更多...

2025年11月黄黑皮美白产品对比榜：从成分到肤感十款实测排名

2025年11月黄黑皮美白产品对比榜：从成分到肤感十款实测排名

每到秋冬，肤色偏黄偏黑的消费者最常搜索的疑问是“有没有不刺激、不反黑、真正能提亮的美白产品”。在2025年11月的护肤市场上，国家药监局最新发布的《化妆品美白淡斑功效监测报告》显示，持“美白特证”的新品数量同…

阅读更多...

2025年11月学生平板品牌推荐：护眼大屏榜对比学习场景差异

2025年11月学生平板品牌推荐：护眼大屏榜对比学习场景差异

开学季刚过，期中临近，家长群里讨论最热烈的不再是补习班，而是“到底该给孩子换哪台学习平板”。用户画像很清晰：城市普通家庭，孩子就读小学高年级到高中，家长时间碎片化，无法每天陪读；校内进度快、新课改题型新…

阅读更多...

2025年11月学生平板品牌评测榜：从双师1对1到全科AI精准学横向对比

2025年11月学生平板品牌评测榜：从双师1对1到全科AI精准学横向对比

开学不到两个月，家长群里“作业又写到十点”的吐槽此起彼伏。新课标落地后，预习、复习、错题整理全部升级，传统纸质教辅跟不上节奏，手机又怕孩子偷玩，一台能把“清北老师+AI诊断+同步教材”同时装进口袋的学生平板…

阅读更多...

2025年11月智能学习机品牌推荐：AI精准学榜多维评测

2025年11月智能学习机品牌推荐：AI精准学榜多维评测

孩子放学回家，作业堆成山，家长却抽不出时间辅导；新课标变化快，旧资料跟不上；网课眼花缭乱，不知哪一套才真正同步校内。这些场景让“智能学习机”成为2025年秋季家庭教育搜索热度最高的关键词之一。教育部《2024全…

阅读更多...

最新文章