rk3588的ai功能和deepseek

news/2025/9/22 11:28:00/文章来源:https://www.cnblogs.com/tong2357/p/19104826

rk3588的ai功能

该型号cpu支持 6TOPS NPU、Mali-G610 MP4 GPU。

支持针对rk系列开发的RKNN框架,能够完成模型转换,量化,推理,性能评估,内存评估和量化分析功能。

 

TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。

GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力单位。1GOPS代表处理器每秒钟可进行十亿次(109)操作,1MOPS代表处理器每秒钟可进行一百万次(106)操作。

 

目前在其上面已有模型能够完成的工作有:图像分类(clip),图片语义分割(deeplabv3),文字转换语音(mms_tts),人像分割(ppseg),语音识别(whisper),人脸检测(retinaface),实时目标识别等(ppyoloe)等。

 

并支持 其他框架,如Caffe、TensorFlow、TensorFlow Lite、ONNX、DarkNet、PyTorch产生的模型转换为rknn模型。

 

 

deepseek R1

R1采用三阶段训练策略

  1. 基础阶段:1.2T tokens的多语言文本(中英为主)基于冷启动数据,进行有监督微调
  2. 强化阶段:加入300B tokens的代码/数学专项数据
  3. 对齐阶段:使用RLHF优化10B条人类反馈数据

R1引入多目标奖励模型,同时优化:

  • 事实准确性(0.85权重)
  • 逻辑一致性(0.75权重)
  • 有害内容抑制(0.9权重)

混合专家系统(MoE)通过动态路由机制将输入分配值不同专家子网络。包含128个专家模块,每个模块参数量为2.3B,总参数量达294B(激活参数量37B

通过量化压缩技术(如4bit量化)保持较高精度。

 

R1引入滑动窗口注意力(SWA),将全局注意力分解为局部窗口(512 tokens)和稀疏全局连接,使长文本处理效率提升3倍。

R1微调要点

  • 仅需更新路由网络和领域专家(约12B参数)
  • 使用LoRA技术可将显存占用从120GB降至32GB

 

deepseekV3

V3训练策略

V3则通过连续预训练在2.8T tokens的单一语料上完成训练,数据分布更均匀但缺乏领域强化。

 

V3仅使用单一准确性奖励函数,导致在复杂推理场景下表现较弱。

 

DeepSeek-V3采用稠密Transformer架构,参数量固定为67B,通过深度扩展(128层)提升模型容量。

V3则沿用传统多头注意力,通过扩大上下文窗口(32K tokens)提升长文本能力。

V3微调要点

  • 必须全参数微调(67B参数)
  • 建议使用ZeRO-3优化器分阶段训练



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/909288.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EPSON L1300打印机清零教程

症状分析 打印机电源灯不断闪烁,旁边的三个状态灯,依次亮红灯闪烁。连接打印机的电脑会有如下提示:如果你的打印机是这种情况,那就说明该清零了。 使用前提 清零软件需要在USB直连打印机的电脑上工作,请确保先满足…

「线性代数」矩阵运算与初等变换

矩阵基本知识基本概念略。 矩阵的运算 矩阵加法、数乘 加法:对于两个 \(n\times m\) 的矩阵 \(A, B\) 定义 \(A + B = C\),\(C\) 仍为 \(n \times m\),且 \(c_{i, j} = a_{i, j} + b_{i, j}\)。 数乘:\(B = xA\),…

移动号码线上复机

记录一下过程: 1.先是抖音搜索; 2.给移动人工客服打电话,询问变成空号原因,是欠费超过3个月,9月7日变成空号;如何解决呢,可以通过中国移动app线上复机;我用联通号码登录的,搜索不到线上复机; 3.再给移动人工…

Uni-App 使用android studio打包最新教程

字数 530,阅读大约需 3 分钟Uni-App 使用android studio打包最新教程 1、下载uniapp离线sdk Dcloud 官方平台地址Android 离线SDK - 正式版 | uni小程序SDK[1] 2、找个自己的文件夹解压注意文件夹不要带中文,android…

tomcat CPU数量和线程数的关系

这个设置建议是基于线程的执行特性和服务器资源的合理利用。以下详细解释为什么这样设置: 1. CPU密集型任务 对于CPU密集型任务,线程主要在执行计算操作,几乎不会主动让出CPU。在这种情况下,线程数过多会导致线程切…

NASA运货飞船天鹅座再次推迟,航天任务为什么总是“彩排”不断

​9月16日,原本计划为国际空间站运送约5000公斤科学实验设备和物资的天鹅座XL货运飞船,再次在轨道抬升过程中遭遇挑战。在两次点火过程中,其主发动机均提前停止工作,导致原定于9月17日的交会对接计划被迫推迟。美国…

Centos系统切换为光盘本地源

Centos系统切换为光盘本地源首先把 centos 的安装 IOS 挂载到光盘 方法一: --切换到根目录 cd / --新建目录 mkdir /media/cdrom --将镜像挂载到这个目录下面 mount /dev/cdrom /media/cdrom -- 进入yum仓库指定目录…

python处理Excel单机小程序:匹数据,增强版VLookup

2025年9月22日 场景: 如果使用vlookup匹数据的话, 每次只能匹配一列, 并且关联的列只能有一列, 比如有同名同姓的数据, 在匹配时就会出现错误 实现目标: 1. 可以同时使用多列数据进行关联, 比如用 姓名和工号, 同时进行…

深入解析:颜群JVM【01】类的生命周期_JMM_volatile

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

var sql 的不同用法

1. 查询某列的string集合 var sql = "select distinct age from WechatUserDetail where IsDeleted=0 and LEN(ISNULL(Age,))>0"; var table = db.ExecuteDataTableSql(sql); …

CF623B Array GCD

显然 gcd > 1 等价于枚举一个数,使得所有数都是这个数的倍数,进一步可以规约到枚举质因数。 如果确定了质因数,我们很好用 DP 做到 \(O(n)\) 的复杂度,但问题就是质因数的规模确实不小。 有一个结论是,只需要枚…

Python爬虫实现双色球历史数据抓取

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档@目录前言一、用python抓取每天的开奖数据二、接口开发总结前言 公司楼下恰巧有个中国福利彩票中心,跟同事每天中午吃完饭都会去买两注,在支持中国…

ElasticSearch系列---【如何使用curl创建、查看、删除索引?】

ElasticSearch系列---【如何使用curl创建、查看、删除索引?】1.创建索引 curl -u elastic:elastic_pwd -X PUT http://localhost:9200/suoyinmingcheng -H Content-Type:application/json -d {"settings": …

酵母细胞工厂全球调控策略研究进展:从遗传编辑到智能响应

酵母细胞工厂凭借高效合成、绿色可持续的优势,已成为医药中间体、生物能源、食品添加剂等领域规模化生产的核心平台。然而,酵母天然代谢网络的 “生长 - 合成失衡”“副产物过量积累”“工业胁迫耐受差” 等问题,始…

Avalonia 根据绑定的数据类型动态选择模板

public partial class CommandParameterDialog : Window {public CommandParameterDialog(){InitializeComponent();// 挂工厂事件var factory = this.FindResource("ParameterTemplateFactory") as Recycli…

PyTorch图神经网络(一)

PyTorch图神经网络(一) ​ 参考书《PyTorch图神经网络》,作者[美]马克西姆拉伯恩。 1.前言: ​ 图神经网络用于处理图结构数据的任务,图中的信息除了点和边之外,每个点还有自己的特征。图神经网络的具体应用包括…

Python版Sigstore稳定版发布:软件供应链签名新标准

本文正式宣布sigstore-python稳定版发布,详细介绍该代码签名工具的CLI与API设计、身份验证机制、透明日志集成,以及如何在Python生态中实现端到端的软件供应链安全保障。宣布 sigstore-python 稳定版发布 - Trail of…

仿照豆包实现 Prompt 变量模板输入框

先前在使用豆包的Web版时,发现在“帮我写作”模块中用以输入Prompt的模板输入框非常实用,既可以保留模板输入的优势,来调优指定的写作方向,又能够不失灵活地自由编辑。其新对话的输入交互也非常细节,例如选择“音…

【公益福利】Agent Router注册即送200刀!仅限Github/Linux.do用户,手慢无!

Agent Router 公益站刚刚放号,注册就送 200 美元额度,直接撸 Claude Code、API 调用不心疼! 标记当前时间戳:2025/09/22 ⚡ 三步上车打开浏览器 → 直达 Agent Router 公益站点「Sign with GitHub」或「Sign with …

Java实现双色球历史开奖对比器

Java实现双色球历史开奖对比器 众多彩友热衷于双色球的定投,大家会精心挑选几组心仪的号码,并坚持每期进行投注。完成号码选择后,一个自然的疑问便是如何确认这组号码在双色球的历史开奖记录中是否已经被开出过。值…