南昌网站建设哪家好薇软通动力和中软国际对比
南昌网站建设哪家好薇,软通动力和中软国际对比,网站被,jq动画效果网站我觉得做深度学习相关的开发#xff0c;要深刻认识到自己的显卡资源有多少#xff0c;以及对应能做一些什么研究
比如今天的我就对这部分认识不深#xff0c;终归还是实践代码少~缺乏经验
我觉得之后要多跑代码#xff0c;多跑工程项目啊。
我今天做了一件什么事情
我企…我觉得做深度学习相关的开发要深刻认识到自己的显卡资源有多少以及对应能做一些什么研究
比如今天的我就对这部分认识不深终归还是实践代码少~缺乏经验
我觉得之后要多跑代码多跑工程项目啊。
我今天做了一件什么事情
我企图在一张3080上训练5.3GB的ControlNet
我一开始没啥概念反正就各种折腾好环境开始训练了忽然发现哦为什么这么慢慢的离大谱
1个epoch需要12500次迭代而一次迭代4分钟大约需要八百多个小时
我不禁好奇
ControlNet训练为什么这么慢?
本质上他其实是属于大模型范畴了
我后来看了一下Controlnet大约十亿参数
要知道某些开源大语言模型基本也就是几十亿起步
好家伙原来如此
所以一般来说 几个GB的模型 就已经有亿个往上的参数了训练自然会慢~
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/87283.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!