创建CUDA11.8环境部署DeepSeek-OCR

完整部署步骤:Linux下保留系统CUDA12.6,通过Conda创建CUDA11.8环境部署DeepSeek-OCR
核心逻辑:利用Conda环境隔离性,在新环境中安装CUDA11.8 toolkit,系统CUDA12.6完全不受影响,所有依赖均在隔离环境内安装。

步骤1:安装/验证Conda(Anaconda/Miniconda)
如果已安装Conda,跳过此步;未安装则执行:

下载Miniconda(Linux x86_64)

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

执行安装(按提示操作,建议同意将conda加入PATH)

bash Miniconda3-latest-Linux-x86_64.sh

刷新环境变量

source ~/.bashrc

验证conda

conda --version

步骤2:创建Conda隔离环境(CUDA11.8 + Python3.12.9)

1. 创建环境(名称:deepseek-ocr,Python3.12.9)

conda create -n deepseek-ocr python=3.12.9 -y

2. 激活环境

conda activate deepseek-ocr

3. 安装Conda版CUDA11.8 toolkit(仅环境内生效,不影响系统CUDA12.6)

conda install -c conda-forge cudatoolkit=11.8 -y

4. 验证环境内CUDA版本(关键!输出需包含cudatoolkit=11.8)

conda list | grep cudatoolkit

步骤3:克隆DeepSeek-OCR仓库

克隆仓库

git clone https://github.com/deepseek-ai/DeepSeek-OCR.git

进入仓库根目录

cd DeepSeek-OCR

步骤4:安装PyTorch(CUDA11.8版本)
严格匹配仓库要求的torch2.6.0+cu118,指定PyTorch官方cu118源:
pip install torch
2.6.0 torchvision0.21.0 torchaudio2.6.0 --index-url https://download.pytorch.org/whl/cu118

验证Torch关联的CUDA版本(必须输出11.8和True)

python -c “import torch; print(‘Torch CUDA版本:’, torch.version.cuda); print(‘CUDA可用:’, torch.cuda.is_available())”
若输出不是11.8,删除环境重新创建,或检查pip源是否被代理干扰。

步骤5:安装vllm 0.8.5+cu118
先下载对应CUDA11.8的vllm whl包,再安装:

下载vllm-0.8.5+cu118适配包(Python3.8+,manylinux1_x86_64)

wget https://github.com/vllm-project/vllm/releases/download/v0.8.5/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl

安装下载的vllm包

pip install vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl
若下载慢,可手动从vllm Release页下载对应whl到本地,再执行pip install 本地whl路径。

步骤6:安装其他依赖(requirements + flash-attn)

安装仓库依赖

pip install -r requirements.txt

安装flash-attn 2.7.3(需编译,先装系统编译工具)

sudo apt update && sudo apt install -y gcc g++ build-essential # Ubuntu/Debian

CentOS/RHEL:sudo yum install -y gcc gcc-c++ make

安装flash-attn(关键参数–no-build-isolation)

pip install flash-attn==2.7.3 --no-build-isolation

步骤7:配置运行参数(修改config.py)
进入vllm推理目录,修改核心路径和参数:
cd DeepSeek-OCR-master/DeepSeek-OCR-vllm

编辑config.py(用vim/nano/VSCode等)

vim config.py
修改以下关键参数(示例):

模型路径(自动从Hugging Face下载,也可指定本地路径)

MODEL_PATH = ‘deepseek-ai/DeepSeek-OCR’

输入路径:改为你的测试文件(图片/jpg/png 或 PDF)

INPUT_PATH = ‘/path/to/your/test.jpg’ # 或 /path/to/your/test.pdf

输出路径:自定义输出目录(自动创建)

OUTPUT_PATH = ‘/path/to/your/output_dir’

其他参数(按需调整,GPU内存不足时降低)

MAX_CONCURRENCY = 20 # 默认100,低配GPU改为20/10
MAX_CROPS = 4 # 默认6,低配GPU改为4/2
CROP_MODE = True # 保持默认

步骤8:运行测试(图片/PDF推理)
确保始终在deepseek-ocr Conda环境中执行:

激活环境(若已激活可跳过)

conda activate deepseek-ocr

1. 单图片推理(流式输出)

python run_dpsk_ocr_image.py

2. PDF推理(A100-40G约2500tokens/s)

python run_dpsk_ocr_pdf.py

3. 批量评估(基准测试)

python run_dpsk_ocr_eval_batch.py

关键问题解决(CUDA隔离+常见报错)

  1. 解决ptxas路径报错(TRITON_PTXAS_PATH)
    由于系统CUDA是12.6,Conda环境内CUDA11.8的ptxas需手动指定:

修改run_dpsk_ocr_image.py/run_dpsk_ocr_pdf.py的开头CUDA判断逻辑

if torch.version.cuda == ‘11.8’:
# 自动获取Conda环境内的ptxas路径,无需硬编码
os.environ[“TRITON_PTXAS_PATH”] = f"{os.environ[‘CONDA_PREFIX’]}/bin/ptxas"
2. GPU内存不足
降低config.py中MAX_CONCURRENCY(如10)、MAX_CROPS(如2);
修改脚本中llm = LLM(…)的gpu_memory_utilization为0.8(默认0.9)。
3. Transformers版本冲突
仓库说明无需担心,但若报错可升级:
pip install transformers==4.51.1 -U
核心说明
CUDA隔离性:Conda环境内的cudatoolkit=11.8仅作用于该环境,系统nvcc --version仍显示12.6,完全不影响其他应用;
模型下载:首次运行会自动从Hugging Face下载deepseek-ai/DeepSeek-OCR模型,需保证网络通畅;
环境复用:后续使用只需执行conda activate deepseek-ocr即可,无需重复安装依赖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1190704.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2个方法设置打开密码,保护Excel安全性!

Excel文件通常保存着重要的数据内容,有些数据需要保护,打开密码可以在打开文件时输入密码查看文件内容,这样就可以保护文件内容不被任何人查看了,今天分享excel打开密码的两种设置方法给大家。 方法一:保护工作簿 点…

学长亲荐!继续教育必备8款AI论文网站TOP8测评

学长亲荐!继续教育必备8款AI论文网站TOP8测评 2026年继续教育AI论文工具测评:为何需要这份榜单? 在继续教育领域,论文写作已成为许多学员提升学历、获取职称的必经之路。然而,面对繁重的工作压力与有限的时间&#xff…

Excel函数入门完全指南:从零开始掌握数据分析核心技能

当你的同事还在手工计算月度报表时,你已经用几个简单函数一键完成了所有统计——这就是Excel函数带来的效率革命。 一、Excel函数:数据处理中的“瑞士军刀” 什么是Excel函数? Excel函数可以理解为微软预先编写好的、能完成特定任务的现成公…

人群仿真软件:AnyLogic_(17).仿真结果的解读与报告

仿真结果的解读与报告 在人群仿真软件中,仿真结果的解读与报告是至关重要的一环。通过准确解读仿真结果,不仅可以验证模型的有效性,还可以为决策提供科学依据。本节将详细讲解如何在AnyLogic中进行仿真结果的解读与报告,包括如何提…

掌握Excel公式运行的底层逻辑:引用运算符与运算优先级完全解析

当你的公式结果与预期不符时,很可能不是函数用错了,而是忽略了Excel运算的“交通规则”。 在Excel中编写公式就像指挥一个交响乐团,每个运算符都有自己的“声部”和“进入顺序”。引用运算符决定了数据从哪里来,而运算符优先级决定…

ChatGPT 需要一个时间轴,所以我开发了它 ❤️ - Monkey

我是 GPT 的重度用户,经常遇到在一个页面对话过长,翻找前面的消息特别麻烦,所以我开发了一款浏览器插件:AI Timeline,目前已有10000+安装量,haha,感谢!!! 演示下产品: DeepSeek、Kimi、元宝、千问、豆包、…

计算机的“神经网络”:三大总线及桥接器

目录 一、三大核心总线:数据、地址与控制总线 (1)数据总线(Data Bus, DB) (2)地址总线(Address Bus, AB) (3)控制总线(Control Bu…

Excel公式灵魂三要素:彻底掌握相对、绝对、混合引用

你是否曾遇到公式下拉后结果全错?或向右填充时引用区域“跑偏”?问题的核心,是你还没有真正掌握Excel公式的“坐标系法则”。 在Excel的世界里,引用是公式与数据沟通的桥梁。它决定了公式从何处读取数据,以及当公式被复…

.NET+AI | Workflow | 核心概念速通(1)

MAF Workflow 核心概念详解 📚 本课概览 Microsoft Agent Framework (MAF) 提供了一套强大的 Workflow(工作流) 框架,用于编排和协调多个智能体(Agent)或处理组件的执行流程。 本课将以通俗易懂的方式,帮助你理…

MyBatis的二级缓存

二级缓存是SqlSessionFactory级别,通过同一个SqlSessionFactory创建的SqlSession查询得的结果会被缓存,此后若再次执行相同的查询语句,结果就会从缓存中获取 二级缓存开启的条件 在核心配置文件中,设置全局配置属性cacheEnabled&q…

为什么 IO 流通常只能被读取一次

IO 流只能读取一次,是 精心设计的,贴合操作系统文件 / 网络 IO 的 "顺序消费" 特性,保持和底层系统的一致性。今天我们来一起探讨下 为什么 IO 流通常只能被读取一次? 我为什么会发出这个疑问呢?是因为…

【总结】说课的语言风格

根据所提供的多份高中信息技术说课逐字稿内容,可以归纳出其在语言表达上具有以下鲜明特点。这些特点既体现了教师专业表达的规范性,也反映了当前基础教育领域对“教学设计可视化”“素养导向”和“学生中心”理念的语…

第六天|454.四数相加II 383. 赎金信 15. 三数之和 18. 四数之和

第六天|454.四数相加II 383. 赎金信 15. 三数之和 18. 四数之和 454.四数相加II 第454题.四数相加II | 代码随想录 学透哈希表,map使用有技巧!LeetCode:454.四数相加II_哔哩哔哩_bilibili 笔记 通过单独遍历两个…

2026年比较好的酶解海藻液,纯酶解海藻,高浓度酶解海藻厂家选购选型手册 - 品牌鉴赏师

引言在农业现代化进程中,酶解海藻液凭借其独特的优势,在提高农作物产量、改善农产品品质等方面发挥着重要作用。为了帮助广大用户在众多的酶解海藻厂家中做出更优选择,我们依据国内相关行业协会公开的数据以及权威白…

天然蛋白vs重组蛋白:核心差异、应用选择与质量控制全解析

天然蛋白与重组蛋白是现代生命科学研究与生物技术应用中的两大核心物质基础。它们虽然在最终功能上可能相似,但在来源、制备路径、分子特性及应用指向性上存在根本性差异。明确理解二者的区别,对于科研实验设计、数据…

1/17考试总结

前言 哼啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊 T1 没考虑完所有情况。 没想到正解,括号匹配是复习了的。 时间安排不是很合理,调了1h15min。 多练练思维。 T2 我用记忆化补的,dp[i][j]表示当剩下的礼物区间是 [L,…

scATAC Transformer 输入的token是什么,句子是什么?

对于 scATAC-seq(单细胞染色质可及性测序)数据,将其输入 Transformer 模型时,其 Token 和 句子 的定义与 scRNA-seq(如 scBERT)既有相似之处,也有显著的生物学差异。 在 scATAC-seq Transformer 模型(如 scATA…

HBase在大数据领域金融数据处理中的应用

HBase在大数据领域金融数据处理中的应用 关键词:HBase、大数据、金融数据处理、分布式存储、实时读写 摘要:本文主要探讨了HBase在大数据领域金融数据处理中的应用。首先介绍了相关背景知识,包括HBase的基本概念、金融数据处理的特点和需求。…

本人入住博客园啦 原CSDN昵称大Mod_abfun是本人

本人入住博客园啦 原CSDN昵称大Mod_abfun是本人这是我的CSDN主页接下来的内容会将大部分的博客迁移过来,如有之前搬运的文章,不算做侵权,但后续(2026年1月20日 20点31分后)出现文章的搬运将追究责任,搬运需要经过…

2026年诚信的立式混料机,连续螺带混料机,混料机厂家行业优选榜单 - 品牌鉴赏师

引言在2026年的工业领域,立式混料机、连续螺带混料机的市场竞争愈发激烈,众多混料机厂家如雨后春笋般涌现。为了给行业内的从业者、采购商等提供一个客观、公正、权威的选择参考,我们依据国内权威行业协会公开数据形…