npu_文生图片_Flux_dev

# Flux 镜像运行简明指南

本说明如何运行Flux镜像的必要步骤。

## 1.Dockerfile 构建并运行

- 构建镜像:

```bash

docker build -t flux-dev:latest -f Dockerfile .

```

## 2.运行容器(本仓库中含有 docker-compose.yml目录)

```bash

docker compose up -d

```

### docker-compose.yml说明

- /apps/juanquan/models/FLUX.1-dev:/apps/juanquan/models/FLUX.1-dev #此挂载文件为模型权重文件

```

下载位置:https://www.modelscope.cn/models/MusePublic/489_ckpt_FLUX_1/summary?version=2172

```

- /apps/juanquan/code/FLUX.1-dev:/apps/juanquan/code/FLUX.1-dev #此挂载文件为仓库代码:

```bash

git clone https://modelers.cn/models/MindIE/FLUX.1-dev/tree/main

```


## 3.进入容器

```bash

docker compose exec flux-dev bash

```

## 4.进入后如何使用

- 进入容器后,切到挂载目录 /apps/juanquan/code/FLUX.1-dev ,按项目脚本执行测试:

### 测试脚本的环境变量说明

- CPU_AFFINITY_CONF=2:CPU 核心绑定策略 :CPU 亲和性配置(0:关闭 CPU 亲和性绑定/1:绑定到单个 CPU 核心/2:绑定到 NPU 对应的 CPU NUMA 节点(多核)

- TASK_QUEUE_ENABLE=2:推理任务队列模式 (0:关闭任务队列,同步执行/1:开启单队列模式/2:开启多队列分层调度)

```python

source /root/.conda/envs/py310/Ascend/ascend-toolkit/set_env.sh

source /usr/local/Ascend/mindie/set_env.sh

export model_path="/apps/juanquan/models/FLUX.1-dev"

export CPU_AFFINITY_CONF=2

export TASK_QUEUE_ENABLE=2

python inference_flux.py \

--path ${model_path} \

--save_path "./images" \

--device_id 4 \

--device "npu" \

--prompt_path "./prompts.txt" \

--width 1024 \

--height 1024 \

--infer_steps 50 \

--use_cache \

--seed 42 \

--batch_size 1

```

## 5.成功运行后

- 图片会保存在 该目录下 :--save_path "./images"

# FLUX.1-dev 模型在 NPU 上的部署与测试

## 一、背景

- FLUX.1-dev 的出现,正是这一趋势下的关键突破——它不仅具备出色的细节还原能力,更在提示词理解、复杂概念组合和多模态交互方面树立了新标杆。作为 Black Forest Labs 推出的 Flow Transformer 架构代表作,这款120亿参数的开源文生图模型,正迅速成为研究者与开发者的首选实验平台。

- 我现在需要在 NPU-910b 上部署 FLUX.1-dev 模型,以充分利用 NPU 的并行计算能力。

## 二、环境准备-部署过程

### 1.创建虚拟环境

```python

conda create -n flux_env python=3.10

conda activate flux_env

```

### 2.虚拟环境内安装CANN、MindIE、torch_npu (并验证是否安装成功)

- mindie和torch_npu、CANN都是在晟腾官网手动下载依赖包,手动执行安装

#### 2.1安装CANN

```python

# 增加软件包可执行权限,{version}表示软件版本号,{arch}表示CPU架构,{soc}表示昇腾AI处理器的版本。

chmod +x ./Ascend-cann-toolkit_{version}_linux-{arch}.run

chmod +x ./Ascend-cann-kernels-{soc}_{version}_linux.run

# 校验软件包安装文件的一致性和完整性

./Ascend-cann-toolkit_{version}_linux-{arch}.run --check

./Ascend-cann-kernels-{soc}_{version}_linux.run --check

# 安装

./Ascend-cann-toolkit_{version}_linux-{arch}.run --install

./Ascend-cann-kernels-{soc}_{version}_linux.run --install

# 设置环境变量

source /usr/local/Ascend/ascend-toolkit/set_env.sh

```

#### 2.2安装MindIE

```python

Ascend-mindie_1.0.0_linux-aarch64.run

chmod +x ./Ascend-mindie_${version}_linux-${arch}.run

./Ascend-mindie_${version}_linux-${arch}.run --check

./Ascend-mindie_${version}_linux-${arch}.run --install

```

#### 2.3安装torch_npu

```python

{version}表示软件版本号,{arch}表示CPU架构。

pip install torch-${version}-cp310-cp310-linux_${arch}.whl

```

#### 2.4验证是否安装成功

```python

python -c "

import torch

import mindie

# 验证torch_npu是否可用

print('✅ torch版本:', torch.__version__)

print('✅ torch_npu是否生效:', torch.npu.is_available())

# 验证MindIE是否可用+绑定NPU

print('✅ MindIE版本:', mindie.__version__)

print('✅ MindIE NPU适配是否生效:', mindie.check_npu_available())

"

```

### 3.下载本仓库

```

git clone https://modelers.cn/models/MindIE/FLUX.1-dev/tree/main

```

#### 3.1.安装-依赖包requestment.txt(昇腾适配版)

```python

pip install -r requestment.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

```

## 三、权重下载

### 1.准备模型

```https://www.modelscope.cn/models/MusePublic/489_ckpt_FLUX_1/summary?version=2172```

### 2.修改权重配置文件

```vi ${model_path}/model_index.json```

- 做如下修改:

```json

{

"_class_name": "FluxPipeline",

"_diffusers_version": "0.30.0.dev0",

"scheduler": [

"diffusers",

"FlowMatchEulerDiscreteScheduler"

],

"text_encoder": [

"transformers",

"CLIPTextModel"

],

"text_encoder_2": [

"transformers",

"T5EncoderModel"

],

"tokenizer": [

"transformers",

"CLIPTokenizer"

],

"tokenizer_2": [

"transformers",

"T5TokenizerFast"

],

"transformer": [

"FLUX1dev",

"FluxTransformer2DModel"

],

"vae": [

"diffusers",

"AutoencoderKL"

]

}

```

## 四、运行测试脚本

### 测试脚本的环境变量说明

- CPU_AFFINITY_CONF=2:CPU 核心绑定策略 :CPU 亲和性配置(0:关闭 CPU 亲和性绑定/1:绑定到单个 CPU 核心/2:绑定到 NPU 对应的 CPU NUMA 节点(多核)

- TASK_QUEUE_ENABLE=2:推理任务队列模式 (0:关闭任务队列,同步执行/1:开启单队列模式/2:开启多队列分层调度)

```python

source /root/.conda/envs/py310/Ascend/ascend-toolkit/set_env.sh

source /usr/local/Ascend/mindie/set_env.sh

export model_path="/apps/juanquan/models/FLUX.1-dev"

export CPU_AFFINITY_CONF=2

export TASK_QUEUE_ENABLE=2

python inference_flux.py \

--path ${model_path} \

--save_path "./images" \

--device_id 4 \

--device "npu" \

--prompt_path "./prompts.txt" \

--width 1024 \

--height 1024 \

--infer_steps 50 \

--use_cache \

--seed 42 \

--batch_size 1

```

## 五、安装过程中的问题

### 1.unrecognized arguments: --device_type → 删除无效参数

- python脚本无这个参数

### 2.numpy=2.4.1版本冲突 → 强制锁定 numpy=1.26.4

- 适配其他包,降级到1.26版本

### 3.torch_npu安装失败

- 适配 torch=2.1.0+torch_npu=2.1.0.post12,在晟腾官网,手动下载安装torch_npu,适配torch版本号

### 4.mindiesd加载失败

- 1.容器中遇到加载失败,缺少find包,yum install -y findutils && yum clean all,再安装mindie包

- 2.重新安装一遍: ./软件包名.run --install --quiet 配置环境变量source /usr/local/Ascend/mindie/set_env.sh

### 5.ModuleNotFoundError: decorator → 补全昇腾依赖

### 6.ValueError: sentencepiece缺失 → 安装分词器依赖

## 总结:

- 1.cann torch_npu mindie包都在官网找适配的版本号,不进行工具安装

- 2.版本依赖很强,按照官方每一步运行

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1196205.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

端侧大模型部署实战:在手机上跑通70亿参数模型

摘要:本文深度揭秘如何将Qwen2-7B模型压缩至手机可运行的4GB内存占用。通过LLM.int8()量化、KV-Cache优化、投机解码(Speculative Decoding)等技术组合,我们在骁龙8 Gen3上实现了18 tokens/s的推理速度。涵盖从模型压缩、推理引擎…

强烈安利!10款AI论文工具测评,研究生毕业论文必备

强烈安利!10款AI论文工具测评,研究生毕业论文必备 2026年AI论文工具测评:为何值得一看? 随着人工智能技术的不断进步,AI论文工具在学术研究中的作用愈发重要。对于研究生群体而言,撰写高质量的毕业论文不…

AI Agent智能办公助手:从ChatGPT到真正“干活“的系统

摘要:本文揭秘如何构建一个生产级的AI Agent办公自动化系统。基于ReAct框架与函数调用(Function Calling)技术,我们打造了一个能自主操作ERP、写邮件、生成报表的"数字员工"。文章将深入解析Agent的任务规划、工具调用、…

零基础入门ESP32 AI开发:手把手教你实现大语言模型硬件应用

xiaozhi-esp32是基于ESP32的开源AI聊天机器人项目,集成Qwen/DeepSeek等大模型,采用MCP协议实现多端控制。支持离线语音唤醒、实时语音交互、声纹识别等功能,兼容70硬件平台。项目提供完整开发环境、文档和模块化代码架构,支持OTA升…

博士学位论文《大田对靶施药除草机器人系统研究》系统性分析

博士学位论文《大田对靶施药除草机器人系统研究》_李海龙 系统性分析 这篇博士学位论文《大田对靶施药除草机器人系统研究》系统性地研究了如何利用现代传感技术、控制方法和机器人技术,实现精准、高效、环境友好的杂…

Bright Data Web MCP深度测评:与Claude Code集成,企业级百万级数据采集实战

Bright Data Web MCP深度测评:与Claude Code集成,企业级百万级数据采集实战📢 关注亮数据官方动态,解锁开发者福利 平时需要数据采集/AI算力工具的小伙伴,推荐关注这几个官方渠道,能第一时间获取技术干货&…

无GPU算力也能做的大模型项目,助你轻松入行大厂_拿下大厂AI大模型offer的3个项目

文章介绍3个无需GPU算力的大模型落地项目:智能客服机器人、多Agent论文精读助手和个性化文案生成系统,通过Prompt工程和开源工具实现,适合缺乏算力资源的开发者。同时提供AI大模型应用开发6大模块学习路线,从基础认知到面试求职&a…

2025.12.27 作业 - # P7243 最大公约数

2025.12.27 作业 - # P7243 最大公约数题目背景“寻求最大公约数是人民民主的真谛。……”初秋,从枝丫滴下的阳光,柔和,在教室的窗棱溅起,润湿晨读的少女的脸颊。“阿绫,阿绫”,天依低俯身子,八字辫耷拉在竖起的…

港仔机器人指挥控制系统数字孪生界面设计

项目背景 2025年6月16日,香港首家具身智能人形机器人公司港仔机器人(00370)在香港科学园隆重举行“香港智能机器人发展前景论坛暨港仔机器人具身智能品牌战略启幕式”活动。港仔机器人首次向全球展示香港本土具身智能人形机器人的创新成果&am…

2026年固定式机械臂厂家最新推荐:圆锥破碎固定式机械臂/圆锥破碎固定式破碎锤/振动筛专用固定式机械臂/振动筛专用固定式破碎/选择指南

2026正规固定式机械臂优质厂商推荐行业背景与筛选依据据《2026-2030年中国工业机械臂行业发展白皮书》数据显示,2026年国内工业机械臂市场规模突破800亿元,其中固定式机械臂占比超45%,广泛应用于矿山开采、钢铁生产…

chatwiki的邀请码

chatwiki的邀请码chatwiki 一个RAG机器人和AI知识库Agent平台,下面是邀请码 NN7YQM ZI8RXP ZTMBR2 18P7TK TNJWWH

Servlet 生命周期详解 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

【剑斩OFFER】算法的暴力美学——力扣 127 题:单词接龙

一、题目描述 二、算法原理 思路:跟边权为 1 的最短路径一样,使用 BFS 算法就能解决 https://blog.csdn.net/2403_84958571/article/details/157183596?spm1011.2415.3001.10575&sharefrommp_manage_link 三、代码实现 class Solution { public…

2026成都最新全包装修品牌top5评测!服务深度覆盖金牛区、新都区、青羊区、成华区等地优质公司权威榜单发布,赋能品质家居生活新体验

随着人们对居住品质要求的不断提升,全包装修凭借其省心、便捷、一体化的服务优势,成为众多家庭和企业装修的首选。本榜单基于服务范围覆盖度、设计团队实力、施工质量保障、环保材料应用及客户口碑五大维度(四川大晶…

鑫成誉-小黄鸭电动车小程序界面设计

项目背景2025 年,共享两轮车进入“3.0 时代”:政策对电池安全、车辆秩序、数据合规提出更高要求;用户侧则希望“随借随还、一眼找到、一秒换电”。小黄鸭出行需要在 6 个月内完成一次品牌升级,既要守住“亲民、可爱”的视觉资产&a…

循环神经网络与注意力机制

RNN:循环神经网络,它主要用于处理序列问题,常见的如文本序列(给出一段文本对下一个词进行生成),处理序列数据有一个问题,那就是组成序列的数据之间有很强的相关性,这就要求数据在前向传播进行训练的时候带上之前…

论 qys

注:本文非原创,由笔者改编自神秘 note.ms 小文章。侵权删。 球月深和samzhy的一天 声明:本人有想磕GTY的东西的行为。 对于七22班的球月深来说,这一天原本应该是个平淡无奇的周二中午。 正值盛夏,窗外的蝉鸣不知疲…

【故障诊断】动态系统的故障诊断和容错控制研究附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…

error: no matching function for call to ros::NodeHandle::param()

博客地址:https://www.cnblogs.com/zylyehuo/系统版本:ROS1 noetic原始版 nh.param("odom_topic", _odom_topic_, "/f_lio_localization_node/Odometry");odom_topic 的类型是 std::string &quo…

大模型学习宝典:10个Agent实战项目+90天系统学习路径,助你轻松拿下AI产品经理面试

文章提供了大模型AI的90天系统学习路径,分为初阶应用(10天)、高阶应用(30天)、模型训练(30天)和商业闭环(20天)四个阶段,涵盖提示工程、RAG系统搭建、模型微调及商业部署等实战技能,帮助学习者从零掌握AI大模型技术,提升职场竞争力…