开发板部署|RK3588部署DeepSeek-1.5B

前言

  在 RK3588 上部署大模型可以显著提升计算效率、节能、加速推理过程,并实现本地化推理,适合各种边缘计算应用,如智能设备、自动驾驶、工业机器人、健康监测等领域。此外,RK3588 配备了强大的 NPU(神经网络处理单元),可以加速深度学习推理过程。通过在 RK3588 上部署大模型,NPU 能够显著提高模型推理速度,减少推理时间,尤其在进行实时推理时十分重要。

1.部署方式

现有我知道的部署方式有两种,一是利用ollama去部署二是使用rknn官方代码库去部署,前者使用cpu,后者使用npu,先说结论两者token速度相差不大。
废话少说,下面分享部署过程。

1.1 利用ollama部署

这里就不多说了,因为之前写过一篇利用ollama部署deepseek的文章,这里就不赘述,直接甩命令:

# 下载并安装ollama
curl -fsSL https://ollama.com/install.sh | sh# 下载deepseek-1.5b
ollama pull deepseek-r1:1.5b# 运行deepseek
ollama run deepseek-r1:1.5b

运行之后可以看到,cpu的占用几乎满了:
!](https://i-blog.csdnimg.cn/direct/7baeb6d85731463fa30e30e6f8cb1a4f.png)

watch sudo cat /sys/kernel/debug/rknpu/load

查看一下npu的占用率,根本没动:
在这里插入图片描述

1.2 官方代码库部署

1.2.1 安装依赖(x86_64机器)

conda create -n rkllm python=3.10
conda activate rkllm
pip install rkllm_toolkit-1.1.4-cp310-cp310-linux_x86_64.whl 

这里的rkllm_toolkit安装包可以去这里下载:rknn-llm,如果嫌下载慢可以私信问我要。

1.2.2 下载模型及转换模型(x86_64机器)

下载项目地址:rknn-llm

下载模型地址:
DeepSeek-R1-Distill-Qwen-1.5B

cd examples/DeepSeek-R1-Distill-Qwen-1.5B_Demo/export/
python export_rkllm.py

转换之前记得修改你的模型路径:
在这里插入图片描述
转换之后地模型后缀为rkllm。

1.2.3 编译运行代码(x86_64机器)(可选)

①先下载下载交叉编译工具链 gcc-arm-10.2-2020.11-x86_64-aarch64-none-linux-gnu
这里多说一句,交叉编译工具链的作用是是为了在x86_64平台下编译arrch平台下能够执行的文件。

②修改examples/DeepSeek-R1-Distill-Qwen-1.5B_Demo/deploy/build-linux.sh中GCC_COMPILER_PATH的路径:
在这里插入图片描述

③开始编译:

cd examples/DeepSeek-R1-Distill-Qwen-1.5B_Demo/deploy/
bash build-linux.sh

如图所示,编译之后所需库和可执行文件在deploy/install/demo_Linux_aarch64/目录下:
在这里插入图片描述

1.2.4 直接下载编译好的代码(x86_64机器)(可选)

如果不想自己编译代码,这里有编译好的代码:

git clone https://www.modelscope.cn/radxa/DeepSeek-R1-Distill-Qwen-1.5B_RKLLM.git

注:1.2.3和1.2.4必选其中一个

1.2.5 运行代码(RK3588)

将转化模型和代码复制到rk3588后,执行以下命令:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:./lib
export RKLLM_LOG_LEVEL=1
./llm_demo DeepSeek-R1-Distill-Qwen-1.5B.rkllm 10000 10000

这里可以看到,cpu的利用率下去了:
在这里插入图片描述
每个npu的占用率大概在30%-40%之间:
在这里插入图片描述

参考

RKLLM DeepSeek-R1
这里推荐一个网站,在Hugging Face下不下来的模型可以在这里下载!!魔搭社区

总结

  本文介绍了两种在RK3588上部署deepseek-1.5b的方法,虽然两种方法的token是差不多的,但是我还是推荐使用npu的方法去推理大模型,后续会继续测试deepseek中更大参数体量的模型,测试一下rk3588的极限在哪里。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/70246.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UDP与TCP

用UDP一定比用TCP快吗? 假设我们需要在a电脑的进程发一段数据到b电脑的进程我们可以选择使用TCP或UDP协议进行通信。 对于TCP这样的可靠性协议每次消息发出后都能明确知道对方有没有收到,就像打电话一样,只要“喂喂"两下对方就能回你个…

【ELK】【Elasticsearch】数据查询方式

1. 简单查询(URI Search) 通过 URL 参数直接进行查询,适合简单的搜索场景。 示例: bash 复制 GET /index_name/_search?qfield_name:search_value 说明: index_name:索引名称。 field_name&#xf…

软件测试:定义和实质

软件缺陷的定义: 未实现说明书要求的功能出现了说明书指明不应出现的错误实现了说明书未提到的功能未实现说明书没有明确提出但应该实现的目标软件难以理解,不易使用,运行缓慢 或者从测试员客户会认为不好的。 软件缺陷的原因: …

【软考】【2025年系统分析师拿证之路】【啃书】第十一章 软件需求工程(十二)

目录 需求的层次需求工程的主要活动需求的记录技术需求分析需求定义 需求的层次 业务需求用户需求系统需求 需求工程的主要活动 需求获取需求分析形成需求规格需求确认和验证需求管理 需求的记录技术 任务卡片场景说明用户故事 需求分析 方法: 结构化分析&a…

计算机网络原理试题六

一、单项选择 1.(单选题,5分)IP地址中网络号的作用有 A.指定了设备能够进行通信的网络 B.指定了主机所属的网络 C.指定了被寻址的子网中的某个节点 D.标志了网络中的主机 答案:B 2.(单选题,5分)关于IP主机地址,下列说法正确的是 A.网段部分不可以全1也不可以全0 B.主机部分可…

路由基础 | 路由引入实验 | 不同路由引入方式存在的问题

注:本文为 “路由基础 | 路由表 | 路由引入” 相关文章合辑。 未整理去重。 路由基本概念 1—— 路由表信息、路由进表以及转发流程、最长掩码匹配原则 静下心来敲木鱼已于 2023-11-26 14:06:22 修改 什么是路由 路由就是指导报文转发的路径信息,可以…

更高效实用 vscode 的常用设置

VSCode 可以说是文本编辑神器, 不止程序员使用, 普通人用其作为文本编辑工具, 更是效率翻倍. 这里分享博主对于 VSCode 的好用设置, 让 VSCode 如虎添翼 进入设置 首先进入设置界面, 后续都在这里进行配置修改 具体设置 每项配置通过搜索关键字, 来快速定位配置项 自动保存…

本地部署DeepSeek

1、下载ollama 浏览器输入ollama,打开ollama网站,选择版本下载 可以使用迅雷下载 打开迅雷,复制网址 2、安装ollama ollama下载完成之后,安装 3、查看ollama版本 Win R,cmd ollama -v 查看ollama版本 4、下载De…

大模型驱动的业务自动化

大模型输出token的速度太低且为统计输出,所以目前大模型主要应用在toP(人)的相关领域;但其智能方面的优势又是如此的强大,自然就需要尝试如何将其应用到更加广泛的toM(物理系统、生产系统)领域中…

Leetcode1299:将每个元素替换为右侧最大元素

题目描述: 给你一个数组 arr ,请你将每个元素用它右边最大的元素替换,如果是最后一个元素,用 -1 替换。 完成所有替换操作后,请你返回这个数组。 代码思路: 方法 replaceElements 输入参数:…

Java 大视界 -- 人才需求与培养:Java 大数据领域的职业发展路径(92)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…

Weboffice在线Word权限控制:限制编辑,只读、修订、禁止复制等

在现代企业办公中,文档编辑是一项常见且重要的任务。尤其是在线办公环境中,员工需要在网页中打开和编辑文档,但如何确保这些文档只能进行预览而无法被编辑或复制,成为许多企业面临的一个痛点。尤其是在处理涉密文档时,…

基于 Spring Boot 和微信小程序的仓储管理系统设计与实现

大家好,今天要和大家聊的是一款基于 Spring Boot 和 微信小程序 的“仓储管理系统”的设计与实现。项目源码以及部署相关事宜请联系我,文末附上联系方式。 项目简介 基于 Spring Boot 和 微信小程序 的“仓储管理系统”主要使用者分为 员工、供应商 和…

Stable Diffusion本地化部署超详细教程(手动+自动+整合包三种方式)

一、 Stable Diffusion简介 2022年作为AIGC(Artificial Intelligence GeneratedContent)时代的元年,各个领域的AIGC技术都有一个迅猛的发展,给工业界、学术界、投资界甚至竞赛界都注入了新的“[AI(https://so.csdn.net/so/search…

WPS的AI助手进化跟踪(灵犀+插件)

Ver V0.0 250216: 如何给WPS安装插件用以支持其他大模型LLM V0.1 250217: WPS的灵犀AI现在是DeepSeek R1(可能是全参数671B) 前言 WPS也有内置的AI,叫灵犀,之前应是自已的LLM模型,只能说是属于“能用,有好过无”,所…

通俗理解-L、-rpath和-rpath-link编译链接动态库

一、参考资料 链接选项 rpath 的应用和原理 | BewareMyPower的博客 使用 rpath 和 rpath-link 确保 samba-util 库正确链接-CSDN博客 编译参数-Wl和rpath的理解_-wl,-rpath-CSDN博客 Using LD, the GNU linker - Options Directory Options (Using the GNU Compiler Colle…

SpringMVC环境搭建

文章目录 1.模块创建1.创建一个webapp的maven项目2.目录结构 2.代码1.HomeController.java2.home.jsp3.applicationContext.xml Spring配置文件4.spring-mvc.xml SpringMVC配置文件5.web.xml 配置中央控制器以及Spring和SpringMVC配置文件的路径6.index.jsp 3.配置Tomcat1.配置…

window中git bash使用conda命令

window系统的终端cmd和linux不一样,运行不了.sh文件,为了在window中模仿linux,可以使用gui bash模拟linux的终端。为了在gui bash中使用python环境,由于python环境是在anaconda中创建的,所以需要在gui bash使用conda命…

在线考试系统(代码+数据库+LW)

摘 要 使用旧方法对在线考试系统的信息进行系统化管理已经不再让人们信赖了,把现在的网络信息技术运用在在线考试系统的管理上面可以解决许多信息管理上面的难题,比如处理数据时间很长,数据存在错误不能及时纠正等问题。这次开发的在线考试…

c/c++蓝桥杯经典编程题100道(19)汉诺塔问题

汉诺塔问题 ->返回c/c蓝桥杯经典编程题100道-目录 目录 汉诺塔问题 一、题型解释 二、例题问题描述 三、C语言实现 解法1:递归法(难度★) 解法2:迭代法(难度★★★) 四、C实现 解法1&#xff1…