完整教程:【Deepseek OCR】重磅测试,mac环境下的体验【本人已经本地实验成功】

news/2025/11/22 16:00:56/文章来源:https://www.cnblogs.com/gccbuaa/p/19256994

文章目录

    • Deepseek ocr 这模型
      • 模型下载
    • 使用用再说
      • 先下下来尝试一下
      • 搭配环境 【conda环境】
      • 使用 hf-mirror.com 替换 https://huggingface.co
      • 报错指南
        • model镜像无法下载
        • 报错cuda错误
      • 最终结果
    • Todo后续会使用gradio来体验
    • 有兴趣拉一下

Deepseek ocr 这模型

在人工智能时代,光学字符识别(OCR)技术已成为数字化转型的核心引擎,从文档扫描到知识提取,其应用正日益扩展。2025年10月20日,DeepSeek-AI团队开源了DeepSeek-OCR模型,这款约30亿参数的视觉-语言模型(VLM)以“上下文光学压缩”(Contexts Optical Compression)为核心创新,通过将长文本转化为视觉令牌,实现7-20倍的压缩率,同时保持高精度。该模型在撰写本文戒指10月23日10:00已在GitHub上迅速积累超过12K星,备受Andrej Karpathy等行业大咖青睥。本文从源码分析、架构设计、本地案例验证及实际使用场景四个维度,深入剖析DeepSeek-OCR的效果与潜力,揭示其在OCR领域的突破性价值。

说了很多,模型参数(3B)足够本地运行了,本人mac 本地环境,想针对该模型进行工作适配。

模型下载

https://huggingface.co/deepseek-ai/DeepSeek-OCR

镜像地址

https://hf-mirror.com/deepseek-ai/DeepSeek-OCR

使用用再说

先下下来尝试一下

git clone https://github.com/deepseek-ai/DeepSeek-OCR.git

如果网络有问题使用如下

git clone https://gitee.com/ZhangALiang/DeepSeek-OCR.git

本人在镜像上用pdf mathTranslate生成了一份中文版论文。可以对照着看。

搭配环境 【conda环境】

conda create -n deepseek-ocr python=3.12.9 -y
conda activate deepseek-ocr

下载依赖

pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0
pip install -r requirements.txt

注意,本人使用pip install torch2.6.0 torchvision0.21.0 torchaudio2.6.0 --index-url https://download.pytorch.org/whl/cu118 无法下载。
也没有安装pip install flash-attn
2.7.3 --no-build-isolation
也就是没有使用vllm

使用 hf-mirror.com 替换 https://huggingface.co

在这里插入图片描述

# HUGGINGFACE_CO_URL_HOME = "https://huggingface.co/"
HUGGINGFACE_CO_URL_HOME = "https://hf-mirror.com/"
_HF_DEFAULT_ENDPOINT = "https://hf-mirror.com"
# _HF_DEFAULT_ENDPOINT = "https://huggingface.co"

报错指南

model镜像无法下载
# 1. 设置镜像源(核心)
os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"
# (可选)2. 设置本地缓存路径(避免每次下载到默认目录)
os.environ["HUGGINGFACE_HUB_CACHE"] = "./my_hf_cache"
报错cuda错误

由于本地是mac的,不支持cuda,那么出现cuda错误,那么就跳转到指定位置,对cuda()注解掉就行。在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

最终结果

识别还是挺准的。就是有点慢

可鞥会更

Todo后续会使用gradio来体验

有兴趣拉一下

代码在
在这里插入图片描述
而且输出内容。有文字内容,同时还有图像分割。
在这里插入图片描述

调整代码地址

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/973194.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用C# Channel实现工位流水线调度系统

在现代制造业中,流水线生产需要精确的工位协作。本文将介绍如何使用C#的Channel实现一个高效的工位流水线调度系统。 1、首先我们准备一个工位接口public interface IWorkstation{string WorkName { get; }Task Start…

福星福袋助手,抖音福袋扭蛋机,抖音抢福袋工具

抖音福星福袋助手,抖音福袋扭蛋机,抖音抢福袋工具 DY福袋工具 抖音福袋福星福袋助手 最新版本群里下载 [2025-11-20] 抖音福星福袋助手,抖音抢福袋工具,抖音无水印视频下载器,抖音直播间录制下载器,抖音批量取消…

2025年发电机制造厂权威推荐榜单:康姆勒原装发电机组/康姆勒发电机组/全自动柴油发电机组源头厂家精选

在能源安全与应急供电需求日益重要的今天,发电机组作为各行业关键电力保障设备,其性能优劣直接关系到企业运营的连续性与稳定性。 发电机组作为重要的电力供应设备,在工业备用电源、基础设施建设、应急救援等领域发…

2025百元白酒精选推荐指南:十大香型佳酿与纯粮酒挑选策略

在白酒消费市场中,百元价位带凭借 “品质与性价比平衡” 的核心优势,成为日常口粮酒、家庭聚会及轻商务宴请的主流选择。据行业统计数据显示,百元档白酒占整体白酒消费市场份额超 35%,且年均增速保持在 12% 以上,…

BLOG1-NCHU-单部电梯调度程序

题目集 1-3 单部电梯调度程序 一.前言历经三周的时间,也是完成了每周一次Java课程的大作业。在我们每次完成的大作业当中均包含着NCHU-单部电梯调度程序的相关题目,并且每周题目呈现迭代递进的特点。从题目集1的NCHU…

Hadoop生态系统怎样优化存储性能

Hadoop生态系统优化存储性能是一个复杂的过程,涉及多个方面。以下是一些关键的策略和步骤,可以帮助您提高Hadoop的存储性能: 硬件优化主节点和从节点的配置:确保主节点(运行NameNode)的内存配置足够高,因为Name…

【matlab】机器学习入门之旅

T = readtable(filename) 通过从文本文件、电子表格(包括 Microsoft Excel)文件、XML 文件、HTML 文件或 Microsoft Word 文档中读取列向数据来创建表。readtable 检测数据元素,如分隔符和数据类型,以确定如何导入…

web漏洞、waf繞過和前端加密繞過

1、安装并使用burp越权检测插件auth_analyzer测试pichachu垂直越权漏洞A.先使用普通帐号登入:B.登入管理员帐号:2、搭建ftp服务器并分别使用hydra和超级弱口令检查工具检查ftp弱口令3、安装captcha-killer-modified插件…

部署tendis 集群

部署tendis 集群1.概述 我们在部署 tendis 集群的时候,我们需要准备 6台机器,3主三从,当然 我们可以将他们部署同一台机器上,只要端口不一样就可以。 我们准备 6个文件夹 端口分别从 7001到 7006 构建过程 2.1.准备…

P4555 [国家集训队] 最长双回文串 踢姐

P4555 [国家集训队] 最长双回文串 踢姐 简要题意: 给定一个字符串 \(S\) ,我们定义字符串 \(T\) 的双回文子串为:存在两个字符串 \(X\) 与 \(Y\) 是 \(T\) 的非空子串,满足 \(X\) 与 \(Y\) 无重叠部分并且两个字符…

2025年水肥一体机制造厂权威推荐榜单:便携式水肥一体机/全自动喷淋系统/简易水肥一体源头厂家精选

随着智慧农业的快速推进,水肥一体化技术正成为现代农业生产的关键支撑。据行业数据显示,水肥一体化设备可有效提高水肥利用率30%以上,成为推动农业现代化转型的核心装备。 水肥一体化技术通过集成灌溉与施肥系统,实…

Java—抽象类 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

23207225-华辉-第一次blog作业

一. 前言 在完成三次大作业的题集后,我兴高采烈地写下写下这片博客,思考人生的意义,也想和大家分享我在这三次大作业中碰见的问题和个人所得。代码为什么错了?错在哪?该如何才能通过题目的测试点?相信很多同学和…

英语_阅读_AI models_待读

When an artificial intelligence model is created, it doesnt have any knowledge. 当一个人工智能模型被创造出来时,它本身并不具备任何知识。 AI companies like OpenAI teach it different things so that it wo…

11.22组会

11.22组会亚克隆文献讲解 使用好ai是第一重要的 gemini最新版 结合ai搭建工具链 使用可以跨平台共享数据的工具,否则已经落后

2025年食品厂生产用水紫外线消毒设备优质厂家权威推荐榜单:牛奶厂紫外线消毒设备/饮料杀菌紫外线消毒设备/啤酒生产紫外线消毒设备源头厂家精选

在食品安全标准日益严格的今天,紫外线消毒技术凭借其高效灭菌、无化学残留的独特优势,正成为食品生产用水处理的核心环节。 根据全球水处理研究报告显示,紫外线消毒设备在食品饮料行业的应用正快速增长。2025年食品…

2025年福建钨钢棒回收公司权威推荐榜单:福州钨钢合金回收/福建钨钢模具回收/福建钨钢块回收服务商精选

在资源循环利用与绿色制造理念深入人心的背景下,钨钢棒回收作为硬质合金资源再利用的关键环节,其专业化水平直接关系到资源利用效率与企业环保合规。 钨钢棒作为一种高价值硬质合金材料,因其高硬度、耐磨性和耐高温…

扩展RTCM消息 - 教程

扩展RTCM消息 - 教程2025-11-22 15:42 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-f…

java.nio.charset.MalformedInputException: Input length = 1

一 背景 启动nacos微服务报如下错误,检查xml文件,未发现问题,经确定是格式问题 二 解决 java -Dfile.encoding=utf-8 启动项,设置编码格式

线段树问题-从熟练到精通

前言 不是每一个文章都要有前言 但是我的有