个人网站 主机怎样利用云盘做电影网站

news/2025/9/23 17:04:09/文章来源:
个人网站 主机,怎样利用云盘做电影网站,济南互联网网站建设价格,如何开一家公司创业2003年夏天的一个周日#xff0c;AI教父Hinton在多伦多大学的办公室里敲代码#xff0c;突然响起略显莽撞的敲门声。门外站着一位年轻的学生#xff0c;说自己整个夏天都在打工炸薯条#xff0c;但更希望能加入Hinton的实验室工作。Hinton问#xff0c;你咋不预约呢#…2003年夏天的一个周日AI教父Hinton在多伦多大学的办公室里敲代码突然响起略显莽撞的敲门声。门外站着一位年轻的学生说自己整个夏天都在打工炸薯条但更希望能加入Hinton的实验室工作。Hinton问你咋不预约呢预约了我们才能好好谈谈。学生反问要不就现在吧 这位年轻学生就是Ilya Sutskever刚刚完成本科二年级的数学课程从教务处打听到“想学机器学习最好去找Hinton教授”。 他照做了也因此成就了一段传奇 从AlexNet到AlphaGo他两次参与改变世界的研究。 OpenAI创立之初挖他去当首席科学家在他的领导下推出了GPT系列早期版本、DALL·E系列、代码大模型Codex直到ChatGPT再次改变世界。 多年后他发动董事会内讧最终与OpenAI彻底分道扬镳全世界都在等待着他的下一个动作。 在OpenAI的时候Ilya并不像Altman那样到处抛头露面也不像Brockman天天在网上分享自己的“编程之禅”。 仅有的几次演讲和访谈中也多是聊技术、宏观思考不常谈及自己的经历最近半年更是销声匿迹。 这次的故事正是来自他的博士导师Geoffrey Hinton。 在与Sana Labs创始人的最新对话节目中Hinton不仅讲了自己的事还回忆了师徒共事期间的一些往事。 20多年过去了很多细节在Hinton的叙述里还是那么鲜活。 这段访谈录像理所当然的火了除了轶事之外还涉及Ilya的一些学术思想怎么来的又是如何发展 2010年Ilya就用GPU开发了一种语言模型 Scaling Law最早是他的一种直觉 两人都认为”语言模型不只是预测下一个token“ 两人都认同“预测即压缩压缩即智能” 个人我当时学压缩算法就觉得香农提出的信息论很神奇 那么Hinton眼中的Ilya到底是什么样子 惊人的原始直觉 Ilya加入实验室后Hinton给他布置的第一个任务是读论文一篇关于反向传播的论文。 下一个周会Ilya回来报告了说“我不理解”。 Hinton很失望内心OS“这孩子看着挺机灵的咋连链式法则求导这么基础的东西都看不懂” Ilya连忙解释哦这个部分我懂了我不理解的是为什么不给梯度加一个sensible functional optimizer Hinto团队后来花了好几年来解决这个问题最初指出问题的却是刚入门一周的Ilya。 像这样的情况后面还在反复发生……Hinton如此评价Ilya 他对事物的原始直觉总是非常好。 但Hinton也说搞不清楚Ilya这种直觉从何而来或许归功于他从小就对人工智能问题感兴趣再加上数学基础很棒。 除了研究直觉学生时期的Ilya也展现了超强的代码和工程能力。 当时还没有TenserFlow或Torch之类流行框架机器学习的主要工具和平台是Matlab。 一项工作需要在Matlab里调整大量矩阵乘法代码Ilya做了一段时间就很不耐烦说要为Matlab写一个界面 我用其他Python等更方便的语言写代码然后能自动转成Matlab代码就好了。 Hinton听说后苦口婆心劝他你可别这得花上一个月时间我们不要分心把手头项目先做完。 Ilya却轻描淡写地说害没事今天早上我已经写完了。 打小就坚信Scaling Law 正如Hinton所言Ilya在很多问题上有惊人的直觉。 今天全AI圈不少人信奉的Scaling LawIlya学生时代就已坚信并抓住各种机会向身边的人安利 只要把模型做得更大它们就会发挥更好的作用。 后来到OpenAI成立之处Ilya的表述更加完善了 如果你有一个大而深的神经网络可以在大量数据上进行训练那么你实际上可以解决任何模式识别问题。 早年间Hinton看来这就像是研究者在没有创新的想法时一种“逃避责任”的表现。 当时的我错了而Ilya基本上是对的。 比如Transformer确实是一种创新想法但实际上起作用的还是规模数据的规模和计算的规模。 Hinton提到在当年那个时间节点没人敢预料计算机速度今后会快上10亿倍最多想象到快100倍就不得了。 如果有今天的计算机当年研究的难题可能会自行解决包括语言模型问题。 此处应插入比尔盖茨曾预言64k内存就足够任何人用了笑话) Ilya在2003年加入Hinton的实验室不知具体何时开始有了Scaling Law的想法可能在他脑海里已经盘旋了20多年。 后来直到2020年GPT-3发布的几个月前OpenAI团队才正式在论文中向世人完整定义和介绍这一理念。 在语言模型上用GPU比AlexNet更早 2010年底Ilya和另一个学生James Martens现DeepMind研究科学家合作研究了一种语言模型后来入选ICML 2011。 RNN架构使用维基百科数据在8张当时最先进的GPU上训练比在AlexNet上使用GPU还早两年。 与今天的大语言模型预测下一个token不一样当时他们尝试的是一次预测一个字符。 这款模型能力有限比如给一段起始文字模型可以继续生成看起来像维基百科文章的语句。 虽然语意上像是胡言乱语但语法和标点符号大部分是准确的引号和括号已经能成对出现主语和动词形态一致比如论文中的一段 生命的意义是古代人类繁殖的传统对于好男孩什么时候移除她更大的来说并不是很有利。在这个节目的协议中几乎一致地重新浮现…… 当年的Ilya并不愿意讨论这项工作的潜在应用。 在维基百科上成功后团队又尝试了纽约时报文章数据目标是教会它根据文字识别不同作者的身份。 但Ilya已经想到并承认如果做的足够好这项技术有一天可能成为洗稿软件的基础。 如今这篇论文的代码依然存放在多伦多大学的服务器上供感兴趣的人研究。 不止是预测下一个token 后来的AlexNet、师徒三人“拍卖”自己加入Google等大家已熟知的故事这里先略过。 Ilya加入OpenAI后虽然不再与Hinton共事但两人的学术思想始终在一条路上。 ChatGPT问世后不少人批评大模型本质上只是统计学预测下一个token就像随机模仿人类说话的鹦鹉。 但Hinton和Ilya师徒二人都认为远不止如此。 在Hinton眼中问题之后的下一个token便是答案的第一个token。 因此学会预测就意味着必须学会理解问题。 这种理解的方式与人类相似同时与老式基于三元组数据的自动补全有根本不同。 今天我们现在已经看到了做一个大语言模型不刻意训练其推理能力就产生了推理能力。 这就是大脑如何学习你在预测视觉的下一帧、听觉的下一个声音。 Ilya更是不遗余力传播这套理论在去年和英伟达老黄的炉边对话中说了这个在OpenAI内讧两周前最后一个公开采访中也讲了这个 当我们训练一个大型神经网络来准确预测互联网上许多不同文本中的下一个单词时我们所做的就是学习一个世界模型。 从表面上看可能只是在学习文本中的统计相关性。 但事实证明为了“只是学习”文本中的统计相关性为了压缩它们神经网络需要学习的是文本生成过程的某种表示。 文本实际上是对世界的投影。 在另一场采访中他走的更远 很好地预测下一个token意味着了解创造该token的深层现实。 这不仅是统计学而是理解创造了这些统计数字的那个世界。 如果真的很擅长预测下一个token就可能根据普通人如何行动的数据外推出拥有非凡智慧和洞察力的人如何行动尽管这种人可能并不存在。 这就是Ilya认为的为什么“预测下一个token”范式有可能抵达AGI甚至有可能超越人类直至ASI。 预测即压缩压缩即智能 在不同场合提到“预测下一个Token”时Ilya大概率会同时提到“压缩”他认为预测即是压缩压缩就是智能的来源。 但Ilya总是从理论的角度去解释这个想法并不容易让所有人都能理解。 比如在UC Berkley的一场演讲中他这样解释 “Kolmogorov压缩器”是理论上能生成特定数据集的、长度最短的一段程序能最小化遗憾值。 随机梯度下降可以看成在软计算机比如大型Transformer的权重里搜索隐含的“Kolmogorov压缩器”。 神经网络越大就越能更好的近似“Kolmogorov压缩器”遗憾值越低。 Hinton也认同这个说法并且在访谈中举了非常形象的例子。 大模型做的是寻找共同结构使用共同结构编码事物这样效率更高。 如果你问GPT-4堆肥和原子弹相似性在哪大多数人类都回答不出来认为它们是非常不同的两种东西。 GPT-4会告诉你虽然他们的能量规模不同时间尺度不同但仍有相同之处 当堆肥变热时产生热量的速度就更快。 当原子弹产生更多中子时产生中子的速度也更快。 通过类比AI就理解了“链式反应”的概念。 Hinton认为AI在利用这种理解去将所有信息压缩到自己的权重中。 一但AI这样做了那么它就有能力理解数百种人类还未见过的类比这就是创造力的来源。 Hinton眼中什么是好学生 说回到两人相遇时Hinton谈到与他交谈没多久就能看出他很聪明。 再多交谈一会就能发现他有很好的直觉而且擅长数学。 所以选Ilya做学生是非常容易做出的决定。 那么如何挑选其他学生Hinton也用了Ilya最擅长的方法跟着直觉走。 如果一个人轻信别人告诉他的一切那就太致命了。 不轻信他人而是尝试将新信息融入自己对世界的理解框架中如果融入不进去就拒绝这是很好的策略。 如果试图吸收被告知的一切最终会得到一个非常模糊的框架。相信一切但是没有用处。 所以Hinton眼中的好学生应该拥有一个坚定的世界观并试图摆弄输入的事实以适应你的观点。 这样虽然也可能陷入深信宗教或坚持致命错误但我认为这种方法仍是正确的。 后来我们也能看到两人都是秉持这样的理念坚持着“大模型不止是预测下一个token”坚持着“预测即压缩压缩即智能”。 他们也都坚持认为这个世界应该更加重视AI带来的风险一个因此离开了工作10年的Google一个因此离开了一手拉扯大的OpenAI。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/913251.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业建网站费用苏州做视频网站广告公司

在西班牙巴塞罗那移动通信大会上,华为公司展台用电子屏展示5G技术。新华社资料图近日,第十二届音乐盛典咪咕汇在上海梅赛德斯奔驰文化中心开幕。周杰伦、张惠妹、G.E.M.邓紫棋等华语乐坛著名歌手悉数亮相。在上海移动、咪咕、华为的合作之下,…

公司做网站找谁公司做网站找谁网站建设设计制作维护

一 清除数据中恒定不变值 如果某个数据长时间不变,默认异常,清除掉该部分数据: # 使用 shift 和 cumsum 来创建一个分组键,每次值改变都会增加组号 g (df[沉淀池3号进水流量] ! df[沉淀池3号进水流量].shift()).cumsum()# 使用…

5118素材网站wordpress小型店商城

作为一个硬核作者,绝不和你扯废话,干货无套路送你 题目一: 给定一个数组arr,求出需要排序的最短子数组长度 要求: 时间o(n),空间o(1) 思路: 有序的数组中,任意一个数字,一定小于左…

论坛网站建设源码下载南昌网站建设模板合作

原文链接:https://blog.csdn.net/XFYBB/article/details/129174579 物料的成本中心,作业价格没有维护 再用FCMLHELP,重新创建一下 se37,FCMLHELP_CHECK_TESTFLAG,打断点,跳过PW

数据全生命周期安全建设方案推荐:双轮驱动架构的实践与创新

在数据安全领域,传统"全生命周期控制"模式面临业务动态化、环境开放化、决策弹性化的三重挑战。全知科技(Data-Sec)提出的"全链路泛监测体系",通过构建"观测面+控制面"双轮驱动架构,…

番禺网站推广公司网站跟wordpress连接

1. 题目 我们将石头放置在二维平面中的一些整数坐标点上。每个坐标点上最多只能有一块石头。 每次 move 操作都会移除一块所在行或者列上有其他石头存在的石头。 请你设计一个算法,计算最多能执行多少次 move 操作? 示例 1: 输入&#xf…

赋能智慧水利:国标GB28181平台EasyGBS在农业水文监控中的落地实践

赋能智慧水利:国标GB28181平台EasyGBS在农业水文监控中的落地实践农业水利,作为国家经济的命脉,正经历着从传统人工管理到数字化、智能化的深刻变革。水库、河道、灌区、泵站等关键设施的安全监控与高效调度,是保障…

VS依赖项显示黄色感叹号、红色叉叉,NU1101找不到包异常情况处理方案

例如:找不到包 Syncfusion.Maui.Toolkit。源 C:\Program Files\dotnet\library-packs, DevExpress 20.1 Local, Microsoft Visual Studio Offline Packages 中不存在具有此 ID 的包一、工具-->Nuget程序包管理器--…

噬菌体展示技术原理深度解析:从基因型-表型偶联到亲和筛选的核心逻辑

在抗体开发、肽药物筛选、蛋白互作研究等领域,噬菌体展示技术凭借 “将外源分子展示与基因信息偶联” 的独特优势,成为连接分子生物学与应用生物技术的关键工具。它通过基因工程手段将外源肽或蛋白的编码基因插入噬菌…

AT_arc197_e [ARC197E] Four Square Tiles

注意到 \(h, w \le 3n - 1\),所以四个瓷砖肯定是上下左右四个类似一个正方形放在一起的。 先算一下主对角线上不相交的时候的方案数,此时再将副对角线线上相交的方案数给减掉容斥即可。

怎么做拍卖网站vivo官方网站进入

靶机下载链接: 百度网盘 请输入提取码 提取码: sqv3 一、主机发现 1.用ifconfig查看kali的ip,因为kali和靶机都开启了NAT模式,使用namp -sP 192.168.101.0/24探测靶机ip 二、信息收集 1.使用nmap扫描靶机 使用nmap -A 192.168.101.108 ,查…

免费信息发布网站有哪些汕头网站建设sthke

论文笔记整理:叶宏彬,浙江大学计算机博士生。论文地址:https://arxiv.org/abs/2009.07543摘要:近年来,神经对话问答的产生已广受欢迎。现有对话模型学习中广泛采用了最大似然估计目标(MLE)。但是…

手机网站整站下载wordpress 编辑器 白色

# 冒泡排序,复杂度为O(n^2) def bubble_sorted(li:list)->list:for i in range(len(li)):# 第几趟exchanged False# 这个是为了防止多余的遍历,如果前面的元素已经是排序好的,那就不需要再进行比较了,减少运行时间for j in ra…

网站开发选择题苏州市建设局网站首页

1、在 Docker 内部以及容器之间管理数据,在容器中管理数据主要有两种⽅式: 数据卷(Data Volumes) 挂载主机⽬录 (Bind mounts)2、数据卷 数据卷 是⼀个可供⼀个或多个容器使⽤的特殊⽬录,它绕过 UFS ,可以提…

开网站是干什么的如何完整建设一个网站

目录 1、简单中间实现 2、使用闭包函数实现中间件 在PHP中,中间件是一种常用的设计模式,用于处理请求和响应,它可以在请求到达目标处理程序之前或响应发送给客户端之前执行一些特定的逻辑。中间件提供了一种灵活的方式来修改或扩展应用程序的…

网站制作首先网站在线建设方案

文章目录 目标数据集图数据逻辑回归模型复习逻辑回归和决策边界绘图决策边界恭喜 目标 在本实验中,你将:绘制逻辑回归模型的决策边界。这会让你更好地理解模型的预测。 import numpy as np %matplotlib widget import matplotlib.pyplot as plt from lab_utils_co…

有一个做名片的网站建设包包网站的目的

(中国软件网讯)怎样让SQL Server 2008数据库可以访问MySQL数据库的数据呢?其实这一实现的过程并不难,可以通过调用MySQL的ODBC驱动,在SQL Server中添加LinkServer的方式实现。本文我们就介绍了这一访问过程,现在我们就开始介绍&am…

网站建设玖金手指排名14专业的高端网站设计公司

开发/测试模型 瀑布模型 设计:技术文档(设计那些接口,库表,mq,定时任务),UI视觉稿 特点:线性的结构。 优点:每个阶段做什么,产出什么非常清晰 缺点:测试人员介入太晚…

不限速网盘盘点,五款免费网盘综合对比

为解决网盘下载限速难题,本文对比评测了5款热门不限速网盘。文章重点分析了坚果云(团队协作与安全同步)、123云盘(免费大容量)、蓝奏云(小文件存储)、115云盘和天翼云盘各自的优劣。该评测旨在通过比较文件分享…

日记2

学Java日记 今天跟着教程敲了验证码生成的代码,一开始总在随机字符索引那报错,后来才发现是把 nextInt(chars.length()) 写成了 nextInt(chars.length) ,少了括号。改对后运行出随机验证码时,特别有成就感! 原来编…