JAX核心设计解析:函数式编程让代码更可控

news/2025/12/7 22:07:28/文章来源:https://www.cnblogs.com/deephub/p/19318973

很多人刚接触JAX都会有点懵——参数为啥要单独传?随机数还要自己管key?这跟PyTorch的画风完全不一样啊。

其实根本原因就一个:JAX是函数式编程而不是面向对象那套,想明白这点很多设计就都说得通了。

先说个核心区别

PyTorch里,模型是个对象,权重藏在里面,训练的时候自己更新自己。这是典型的面向对象思路,状态封装在对象内部。

JAX的思路完全反过来。模型定义是模型定义,参数是参数,两边分得清清楚楚。函数本身不持有任何状态,每次调用都把参数从外面传进去。

这么做的好处?JAX可以把你的函数当纯数学表达式来处理。求导、编译、并行,想怎么折腾都行,因为函数里没有藏着掖着的东西,行为完全可预测。

 

https://avoid.overfit.cn/post/52fcdfd1d8054dcbb31783ed0547850e

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/991845.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20232305 2025-2026-1 《网络与系统攻防技术》实验八实验报告

1.实验内容 1.1 学习Web前后端语言. 1.2 搭建一个简单的登录网站。 1.3 尝试对网站进行SQL注入,XSS,CSRF攻击。 2.实验过程 2.1 Web前端HTML 2.1.1 安装,启停Apache Apache是一种开源Web服务器软件,其核心功能是接…

患者投诉管理,是否正面临这些难题?

院长码上办 www.yzmsb.com医院投诉管理,是否正面临这些难题? 传统手工模式已难以满足 医院等级评审 与 患者服务提升 的双重挑战 渠道分散,数据孤岛意见箱没人投,电话记不住。投诉散落在各个角落,缺乏统一台账,极…

NOIP 游记

NOIP 游记考后光顾着玩了,给忘了 这几天一直在补文化课,12.7 号今天才有时间 因为各种原因吧,这是我学这么多年来第一篇游记 感觉有好多话要说,却不知道从何说起 感觉成绩倒是很小一部分,大多是有了很多感想 算了…

CF794E Choosing Carrot

Sol 假设 \(p=\left\lfloor\frac{n}{2}\right\rfloor\),如果没有额外操作:如果 \(n\) 是奇数,答案就是 \(\max (\min(a_{p-1},a_{p}),\min(a_{p},a_{p+1}))\)。 如果 \(n\) 是偶数,答案就是 \(\max (a_{p},a_{p+1}…

澄清:梯度下降优化的是模型参数,而非损失函数本身

澄清:梯度下降优化的是模型参数,而非损失函数本身 在深度学习的表述中,“通过梯度下降(如SGD、Adam)优化损失函数”是一个口语化的简化说法,很容易引发误解——它的真实含义并不是修改损失函数的公式或参数,而是…

用心算感受天地运行法则的气功

用心算感受天地运行法则的气功 不断幻想,在天地之间存在一个算盘,我们按照珠算口诀,在算盘上计算星球的运行轨道。星系的运行轨道,使自己感悟宇宙的运行法则。 不断幻想,在天地之间存在一个算筹,我们按照算筹的计…

一文带你搞懂 AI Agent 开发利器:LangGraph 与 LangChain 区别

https://blog.csdn.net/xxue345678/article/details/149394171https://github.com/godmaybelieve

core学习之路

定位具体错误 ID (对应恢复序列):在步骤 2 中识别出的受影响核心上(或通过安全访问指向该核心的重分发器),读取 GICR_ISERRR0 和 GICR_ISERRR1E 。任何置 1 的位均表示对应的 PPI 或 SGI 处于错误状态。清除与恢复…

XXL-JOB v3.3.1 发布 | 升级SpringBoot4、健壮性增强

XXL-JOB 正在角逐 “2025 年度Gitee最受欢迎的开源软件”,期待您投出宝贵一票,你的认可对我们很重要🌹~投票链接👉:https://gitee.com/activity/2025opensource?ident=ISLBOHRelease Notes1、【新增】新增 “…

梯度:明明是个“方向”,为啥偏叫“度”?

梯度:明明是个“方向”,为啥偏叫“度”? 提到“梯度”,很多人第一次见这个词都会犯嘀咕: 它明明是深度学习里给模型指路的“方向标”,告诉模型该往哪走才能让预测更准,怎么看都是个方向概念,为啥名字里带个“度…

苹果游戏订阅服务新增六款作品,涵盖模拟与动作冒险类型

文章介绍了苹果游戏订阅服务Apple Arcade新增的六款游戏,包括《PowerWash Simulator》和《海绵宝宝:蟹堡追逐2》等,详述了各游戏的特色和优化,并提及了服务的订阅价格和包含内容。SpongeBob and PowerWash Simulat…

U渠道:构建百万级广告甲乙方资源生态,助力行业高效对接与价值共赢

U渠道:构建百万级广告甲乙方资源生态,助力行业高效对接与价值共赢(本报讯)随着数字广告行业进入精细化运营阶段,广告主(甲方)与服务商(乙方)的高效对接需求日益迫切。作为国内广告行业头部学习与资源平台艾奇…

陪诊不是“陪跑”——北京陪诊机构调研榜出炉,三家机构凭实力登榜

周三清晨的协和医院门诊大厅,72岁的张大爷攥着老花镜和一摞检查单站在自助机前犯愁。“儿女在外地,我连取号都摸不着头脑。”话音刚落,穿蓝色工牌的陪诊师李姐已快步上前,熟练地帮他完成挂号、医保关联,还顺手把检…

深入解析:【WPF】WrapPanel的用法

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

梯度下降:站在碗壁,如何找到最低点?

梯度下降:站在碗壁,如何找到最低点? 想象你站在一个巨大、光滑的陶瓷碗的内壁上。 你被蒙住眼睛,看不见碗底,也看不到碗口——但你知道:真正的目标在碗的最底部。 这,就是深度学习中“梯度下降”的核心画面。�…

牛客周赛121

A.幽幽子想吃东西每n吨获得a点满意度,最后判定一下n顿是否大于b吨决定是否要减去c的满意度即可void solve(){int a,b,c,n;cin>>a>>b>>c>>n;int ans=n*a-(n<=b)*c;cout<<ans<<…

微信小程序开发案例 | 幸运抽签小工具(上)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

学习笔记

SCHEMATA#kali安装bloodhoundcd /opt wget https://github.com/SpecterOps/BloodHound Legacy/releases/download/v4.3.1/BloodHound-linux-x64.zip unzip BloodHound-linux-x64.zip mv /opt/BloodHound-linux-x64.zi…

10407_基于springboot的就业信息分享系统

1、项目包含 项目源码、项目文档、数据库脚本、软件工具等资料; 带你从零开始部署运行本套系统。 2、项目介绍 本系统聚焦于运用 Java 技术设计并实现一个就业信息分享系统,旨在为求职者、招聘企业以及高校就业指导部…

北京陪诊服务市场调研揭晓,三大机构凭何脱颖而出?

电话铃声在等候区响起,一位年轻的陪诊员正轻声向患者家属解释检查流程,而墙上的时钟显示,这已经是她今天陪同的第三位病人。 北京三甲医院门诊大厅里,一位陪诊员正陪同老年患者穿梭在不同科室之间。随着人口老龄化…