自助建站优化排名兰州线上广告推广

pingmian/2025/10/8 8:22:58/文章来源:
自助建站优化排名,兰州线上广告推广,新手怎么做网页,江西省赣州市章贡区来源#xff1a;深度学习自然语言处理链接#xff1a;https://zhuanlan.zhihu.com/p/74249758导读十年前#xff0c;MSRA的夏天#xff0c;刚开始尝试机器学习研究的我面对科研巨大的不确定性#xff0c;感到最多的是困惑和迷茫。十年之后#xff0c;即将跨出下一步的时候… 来源深度学习自然语言处理链接https://zhuanlan.zhihu.com/p/74249758导读十年前MSRA的夏天刚开始尝试机器学习研究的我面对科研巨大的不确定性感到最多的是困惑和迷茫。十年之后即将跨出下一步的时候未来依然是如此不确定但是期待又更多了一些。这其中的变化也带着这十年经历的影子。起始科研是什么我从大三开始进入交大APEX实验室有幸随着戴文渊学长做机器学习当时的我觉得“机器学习”这个名字十分高大上然后选择了这个方向但是做了一年之后依然摸不着头脑心中十分向往可以做科研独立写论文的生活却总是不知道如何下手。文渊在我进实验室的一年后去了百度。当时还没有得到学长真传的我开始了我科研的第一阶段从大四到硕士的第二年期间一直自己摸索不断地问自己 “科研是什么”。和课程作业不同学术研究没有具体的问题具体的方法具体的答案。文渊的离开让我一下子不知道该怎么做当时的我想法很简单快点寻找一个具体的方向完成一篇论文。因为ACM班的机会暑假在MSRA的短暂实习虽然学会了很多东西但并没有给我答案。MSRA回来之后在实验室薛老师的建议下我选择了一个现在看来正确而又错误的方向 -- 深度学习。那是AlexNet出现之前两年深度学习的主流热点是非监督学习和限制玻尔兹曼机。没有导师的指导没有工具当时我靠着实验室的两块显卡和自己写的CUDA代码开始了死磕深度学习的两年半。实验室的学长问我你准备要干啥我说“我要用卷积RBM去提升ImageNet的分类效率。”这一个回答开启了图书馆和实验室的无数个日日夜夜为了给实验室的老机器多带一块高功率的显卡我们打开了一台机器的机箱在外面多塞了一个外接电源。我的生活就持续在调参的循环中可视化权重的图片, 看上去那么有点像人脸但是精度却总是提不上来再来一遍。从一开始hack显卡代码的兴奋到一年之后的焦虑再到时不时在树下踱步想如何加旋转不变的模型的尝试在这个方向上我花费了本科四年级到硕士一年半的所有时间直到最后还是一无所获。现在看来当时的我犯了一个非常明显的错误 -- 常见的科学研究要么是问题驱动比如“如何解决ImageNet分类问题”要么是方法驱动如 “RBM可以用来干什么”。当时的我同时锁死了要解决的问题和用来解决问题的方案成功的可能性自然不高。如果我再多看一看当时整个领域的各种思路比如Lecun在很早的时候就已经做end to end或许结局会不那么一样吧。当然没有如果当时赌上了两年半时间的我留下的只是何时能够发表论文的紧张心情。焦虑的我开始打算换一个方向因为RBM当时有一个比较经典的文章应用在了推荐系统上我开始接触推荐系统和KDDcup。比较幸运的是这一次我并没有把RBM作为唯一的一个方法而是更加广泛地去看了推荐系统中的矩阵分解类的算法并且在实验室搭建了一个比较泛用的矩阵分解系统。推荐系统方向的耕耘逐渐有了收获我们在两年KDDCup11中获得了不错的成绩。KDD12在北京放弃了一个过年的时间我完成了第一篇关于基于特征的分布式矩阵分解论文并且非常兴奋地投到了KDD。四月底的时候我们收到了KDD的提前拒稿通知 -- 论文连第一轮评审都没有过。收到拒稿通知时候的我心情无比沮丧因为这是第一篇自己大部分独立推动完成的文章。转折在五月KDDCup12 封榜我们拿到了第一个track的冠军我依然还记得拿到KDDCup12冠军的那一个瞬间我在状态里面中二地打了excalibur仿佛硕士期间的所有阴霾一扫而尽。那时候的我依然还不完全知道科研是什么但是隐隐之中觉得似乎可以继续试试。第零年可以做什么我对于科研看法的第一个转折在于我硕士临近毕业的时候。李航老师来到我们实验室给了关于机器学习和信息检索的报告并且和我们座谈。在报告的过程中我异常兴奋甚至时不时地想要跳起来因为发现我似乎已经知道如何可以解决这么多有趣问题的方法但是之前却从来没有想过自己可以做这些问题。联系了李航老师之后在同一年的夏天我有幸到香港跟随李航和杨强老师实习。实验室的不少学长们曾经去香港和杨强老师工作他们回来之后都仿佛开了光似地在科研上面突飞猛进。去香港之后我开始明白其中的原因 -- 研究视野。经过几年的磨练那时候的我或许已经知道如何去解决一个已有的问题但是却缺乏其他一些必要的技能 -- 如何选择一个新颖的研究问题如何在结果不尽人意的时候转变方向寻找新的突破点如何知道整个领域的问题之间的关系等等。“你香港回来以后升级了嘛。” -- 来自某大侠的评论。这也许是对于我三个月香港实习的最好概括的吧。香港实习结束的时候我收获了第一篇正式的一作会议论文(在当年的ICML)。因为KDDCup的缘故我认识了我现在博士导师Carlos的postdoc DannyDanny把我推荐给了Carlos(UW)和Alex(CMU)。我在申请的时候幸运地拿到了UW和CMU的offer。在CMU visit的时候我见到了传说中的大神学长李沐他和我感叹现在正是大数据大火的时候但是等到我们毕业的时候不知道时代会是如何不过又反过来说总可以去做更重要的东西。现在想起这段对话依然唏嘘不已。我最后选择了UW开始了我六年的博士生活。感谢博士之前在APEX实验室和香港的经历在博士开始的时候我似乎已经不再担心自己可以做什么了。第一年意外可以收获什么如果给我在UW的第一年一个主题的话或许是“意外”。在交大时候因为兴趣的关系一直去蹭系统生物研究员敖平老师的组会探讨随机过程和马尔可夫链。到UW的第一个学期我无意看到一篇探讨如何用Lagevin过程做采样的文章我想这不就是之前组会上探讨过的东西么原来这些方法也可以用到机器学习上。我直接借用了原来的交大学会的知识完成了第一篇高效采样HMC的文章。我后来并没有继续在这个方向上面耕耘下去不过另外一位同在组会的学弟继续基于这个方向完成了他的博士论文。同样的在这一年我和导师开始“质疑深度学习” -- 如果别的机器学习模型有足够大的模型容量和数据是否可以获得和深度学习一样的效果呢当时Carlos看好kernel methods而我因为过去的一些经历决定尝试Tree Boosting。虽然最后在vision领域依然被卷积网络打败而尝试挑战失败但是为了挑战这一假说而实现高效Tree boosting的系统经过小伙伴建议开源成为了后来的XGBoost。在第一年暑假结束的时候因为偶然的原因我开始对quantile sketch算法感兴趣。这里主要的问题是如何设计一个近似的可以合并的数据结构用来查找quantile。这个方向有一个经典的方案GK-sketch的论文但是只能够解决数据点没有权重的情况。经过一两天的推导我在一次去爬山的路上终于把结论推广到了有权重的情况。有趣的是新的证明比起原来的证明看起来简单很多。这个结论没有单独发表但是后来意想不到地被用到了分布式XGBoost算法中证明也收录在了XGboost文章的附录中。研究并不是一朝一夕做想做的事情把它做好开始的时候兴趣使然而在几年之后意想不到的地方获得的收获这样的感觉非常不错。第二年和第三年选择做什么在新生聚会上Carlos对我说你已经有论文的发表经历了接下来要静下心来做大发的“只做best paper水平的研究”。和很多nice的导师不同Carlos对于学生的要求非常严格说话也是非常直白甚至于“尖刻“。很多的老师不论我们提出什么样的想法总会先肯定一番而Carlos则会非常直接地提出质疑。一开始的时候会非常不习惯感觉到信心受到了打击但是慢慢习惯之后开始习惯这样风格。现在看来诚实的反馈的确是我收益最大的东西。我进入博士的一年之后主要在想的问题是做什么样的问题可以值得自己深入付出做扎实有影响力的工作。在博士的第三年Carlos再建议我把XGBoost写成论文用他的话说“写一篇让读者可以学到东西的文章”。和传统的写法不同我们在文章的每一个章节插入了实验结果验证当章节提出的观点。而他对于做图的处理也成为了我现在的习惯直接在图里面插入箭头注释减少读者的阅读负担。经过几次打磨论文终于成为了我们想要的模样。博士前对于深度学习遗憾让我又逐渐把目光转回到深度学习。这个时候我选择了不再一个人作战在博士的第二年和第三年我和兴趣使然的小伙伴们合作一起开始了MXNet的项目。项目从零开始在短短的一年时间里面做出完整的架构。我第一次看到集合了大家的力量齐心协力可以创造出什么样的东西。研究的乐趣不光是发表论文更多还是可以给别人带来什么或者更加大胆地说 -- 如何一起改变世界。博士第二年暑假我在小伙伴的介绍下进入Google Brain跟随Ian Goodfellow实习。当时GAN的论文刚刚发表我也有幸再成为Ian的第一个实习生。实习的开始我们讨论需要做的问题Ian和我把可能要做的项目画在一个风险和回报的曲线上让我选择。到最后我选择了自己提出的一个课题在这个曲线里面风险最高回报也最高。我一直有一个理想希望可以构建一个终身学习的机器学习系统并且解决其中可能出现的问题。这个理想过于模糊但是我们想办法拿出其中的一个可能小的目标 -- 知识迁移。如果一个机器学习系统要终生学习那么在不断收集数据之后必然需要扩充模型的规模来学习更广或者更深按照现在的做法我们在模型改变之后只能抛弃原来的模型重新训练这显然是不够高效的。是否有一个方法可以从已经训练好的网络上面进行知识迁移也就成为了一个重要的问题。我先花了一个半月的时间尝试了比较显然的Knowledge distillation的方法一直没有得到正面的结果。在最后的一个月我改变了思路。实习结束的前一个星期我打开Tensorborard上最近一组实验的结果实验表明新的思路正面的效果。这最后几步的幸运也让我的这一个冒险之旅有了一个相对圆满的结果。这篇论文最后被发表在了ICLR上也是我最喜欢的结果之一。博士的第三年我和小伙伴们开发了一种可以用低于线性复杂度就可以训练更深模型的内存优化算法。当时我非常兴奋地把这一结果写下来然后把稿子后给导师看。他和我说Hmm,这个结果如果投到NeurIPS的话或许可以中一篇poster但是这并不是特别有意思。在我沉默之后他又补充了一句论文并非越多越好相反你可能要尝试优化你的论文里面最低质量的那一篇。最后我们只是把这篇论文挂在了Arxiv上。Carlos的说法或许比较极端这篇论文依然影响了不少后面的工作但也的确是对的用李沐之前说过的一句话概括保证每一篇论文的质量接近单调提升已经是一件难以做到但是又值得追求的事情。选择做什么眼光和做出好结果的能力一样重要眼界决定了工作影响力的上界能力决定了到底是否到达那个上界。交大时敖平老师曾经和我说过一个人做一件简单的事情和困难的事情其实是要花费一样多的时间。因为即使再简单的问题也有很多琐碎的地方。要想拿到一些东西就必然意味着要放弃一些其他东西既然如此为什么不一直选择跳出舒适区选一个最让自己兴奋的问题呢。第四年之后坚持做什么博士第三年我和小伙伴们参加GTC结束后老黄party的角落里我一个人在发呆。深度学习的框架发展已经铺开可接下来应该做什么我一下子感到迷茫。第三年的暑假我没有去实习而是决定一个人在学校尝试开发脑海中显现的抽象概念 -- 深度学习中间表示。暑假结束之后我完成了第一个版本可以比较灵活地支持深度学习系统里面的计算图内存优化。但是总是觉得还缺少着什么 -- 系统的瓶颈依然在更接近底层的算子实现上。暑假之后在去加州的飞机上我尝试在纸上画出为了优化矩阵乘法可能的循环变换回来之后我们决定推动一个更加大胆的项目 -- 尝试用自动编译生成的方式优化机器学习的底层代码。这个项目早在之前我也有一些想法但是一直没有敢去吃这个螃蟹。原因是它的两个特点从零开始横跨多领域。因为要做底层代码生成和想要支持新的硬件我们需要重新搞清楚很多在之前被现有的操作系统和驱动隐藏掉的问题这就好象是在一个荒岛上一无所有重新搭建起一个城堡一样。而这里面也涉及了系统程序语言体系结构和机器学习等领域。这让我想起之前在ACM班时候重头搭建编译器和MIPS处理器并且连接起来的经历。也是那段经历让我觉得为了解决问题去吃多个领域的螃蟹是个让人兴奋的事情。那段经历给我留下的第二个印记是理解了合作和传承的重要性。这门课程设计有一个传统每一门课程的老师都由上一届学长担任。每一届的同学都会在之前的基础上有所改进。我也曾经为这门课做过一些微小的贡献。演化到现在这门课程已经从只做简单的答辩到现在已经有在线评测的OJ。大家一起的合作塑造了这个课程。推动新的机器学习系统和塑造这门课程需要各个团队的同学合作足够时间的耐心关注和不断地改进。我的合作者们也被“卷入”到了这个项目中。我的体系结构合作者一直想要设计新的AI硬件我在雏形完成之后花了大量的时间讨论如何协同设计新的硬件的问题。我们开始讨论怎么管理片上内存怎么可以比较容易地生成指令集甚至怎么调度内存读写和计算并行的问题都暴露出来。有一天我和合作者说我们需要引入虚拟线程的概念来隐藏内存读写开销然后他很快和我说这是体系结构里面经典的超线程技术发明人正是我们的系主任Hank。我们也在不断地重新发现经典的问题的解决方法在新场景的应用让我觉得上了一堂最好的体系结构课程。两年间的不少关键技术问题的突破都是在有趣的时候发生的。我在排队参观西雅图艺术博物馆的infinity mirror展览的途中把加速器内存拷贝支持的第一个方案写在了一张星巴克的餐巾纸上。到后来是程序语言方向的同学们也继续参与进来。我们争论最多的是如何平衡函数式语言和经典计算图做出让大家都可以搞懂的中间表达这一讨论还在不断继续。经过大家的努力TVM的第一篇论文在项目开始的两年之后终于发表。两年间参与项目的同学也从两个人到一个团队再到一个新的lab和一个社区这两年也是我博士期间最充实的两年。因为做了不少“跨界”的工作我常被问起你到底属于哪个领域。过去半年一直在各地做报告报告这样开头算法突破数据的爆发计算硬件的提升三者支撑了机器学习的变革而整合这三者的则是机器学习系统。这也是为什么我要做机器学习系统的原因。曾经一个教授问我这样的问题如果明天有一样新的化学反应过程可能带来机器学习的变革你会怎么做。我答道“我会投入去学习研究这个化学过程”。虽然我不知道遥远的未来会需要什么到底是系统算法还是化学从问题出发用尽所有可能的方法去最好地解决机器学习问题应该这就是我想要坚持的研究风格吧。总结在写这篇总结的时候心中有不少感叹。我常想如果我在焦虑死磕深度学习的时候我多开窍一些会发生什么如果我并没有在实习结束的时候完成当时的实验又会怎样。但现在看来很多困难和无助都是随机的涨落的一部分付出足够多的时间和耐心随机过程总会收敛到和付出相对的稳态。每个人的研究道路都各不相同我的经历应该也是千万条道路中其中一条罢了。博士的经历就好像是用五年多时间作为筹码投资给自己去突破自己做自己原来想不到的事情。各种坎坷曲折都是无可替代的一部分。科研从来不是一个人的事情对于我来说特别是如此。我在交大的时候和一群年轻的同学一起摸索推荐系统的算法而在博士期间搭建的每一个系统都包含了很多合作者一起的努力。也正是大家一起的努力才带来了现在的成果。我个人在这十年间受到了不少老师同学家人的鼓励和帮助感谢他们给予了我这无比珍贵的十年时光。张亚勤、刘慈欣、周鸿祎、王飞跃、约翰.翰兹联合推荐这是一部力图破解21世纪前沿科技大爆发背后的规律与秘密深度解读数十亿群体智能与数百亿机器智能如何经过50年形成互联网大脑模型详细阐述互联网大脑为代表的超级智能如何深刻影响人类社会、产业与科技未来的最新著作。《崛起的超级智能;互联网大脑如何影响科技未来》2019年7月中信出版社出版。刘锋著。了解详情请点击【新书】崛起的超级智能互联网大脑如何影响科技未来未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。  如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/89835.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国民航机场建设集团公司网站应用商城app下载

8.22笔记 8.22笔记一、Hive的HQL语法重点问题1.1 DDL1.1.1 Hive中数据表的分类问题1.1.2 特殊的数据类型 1.2 DML1.3 DQL1.3.1 查询语法和MySQL大部分都是一致的 1.4 讲了三个数据库的可视化工具1.4.1 navicat1.4.2 dbeaver1.4.3 chat2db 二、Hive中重点问题:Hive函…

奥迪汽车建设网站百度销售系统登录

From: http://www.crifan.com/python_third_party_lib_html_parser_beautifulsoup/ 背景 在Python去写爬虫,网页解析等过程中,比如: 如何用Python,C#等语言去实现抓取静态网页抓取动态网页模拟登陆网站 常常需要涉及到HTML等网…

厦门手机网站建设是什么意思商业计划书ppt免费模板下载

要想成为越来越吃香的IC工程师,就会先经历初期的成长阶段。今天就来聊聊初入行的ICer如何快速提升自己的竞争力(验证篇)。 首先希望大家在选择IC行业的时候就有清晰的认知,这是一个不得不深耕技术的行业。我们今天所谈论的快速提…

北京网站定制建设17网站一起做网店潮汕

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 摘记以下格言,愿已今生不忘:------------------------------------------------------- 1) 忽视就是一种认输。 …

适合seo优化的站点免费注册google账号

python中空格属于字符吗?答案是肯定的,空格在Python中也是属于字符的。案例:输入一行字符,分别统计出其中英文字母、空格、数字和其它字符的个数。#!/usr/bin/python# -*- coding: UTF-8 -*-import strings raw_input(input a st…

基于个性化推荐的电商网站设计与实现seo实战密码在线阅读

们有不同类型的小部件用于不同的目的,帮助我们简化操作。小部件用于使代码变得简单且用户友好,这将有助于软件的编码和编程方面。在 Odoo 14 开发中,我们可以利用不同的小部件,这些小部件可用于编程操作的某些特定方面。这些简化工…

杭州模板建站代理制作网站服务

html判断当前页面是否在iframe中的实例在做HTML页面的时候,经常会遇到“如果当前页面显示在iframe中,我们就相应的处理”判断方法为://判断是否在iframe中if(self!top){parent.window.location.replace(window.location.href);}以上这篇html判…

站点建设方案宜宾建设教育培训中心网站

众所周知,光纤收发器是一种将双绞线电信号和光纤的光信号进行互换的以太网传输设备,因此也被称为光电转换器。使用光纤收发器可以将网络的传输距离延伸到100公里以上。相信大家在光纤收发器使用过程中,有时候会遇到一些问题的,最近进碰到有用…

陕西省信用建设官方网站线上推广公司

建筑行业快速发展,各建筑工程的建设规模在不断扩大,各岗位工作人员的工作内容所涉及的方面也越来越广泛。随着信息技术水平不断提高,人工记录的方式已经不能够满足大项目的管理要求,就此,创造出一种新型的施工管理技术——智慧工地…

网站建设费税率多少钱xyz域名

目录 一、实现消息持久化 1.1、消息的存储设定 1.1.1、存储方式 1.1.2、存储格式约定 1.1.3、queue_data.txt 文件内容 1.1.4、queue_stat.txt 文件内容 1.2、实现 MessageFileManager 类 1.2.1、设计目录结构和文件格式 1.2.2、实现消息的写入 1.2.3、实现消息的删除…

自己网站可以加标志吗福州网站建设 网站设计 网站制作

Prompts ​ 语言模型的提示是用户提供的一组指令或输入,用于指导模型的响应,帮助模型理解上下文并生成相关且连贯的基于语言的输出,例如回答问题、完成句子或参与某项活动。对话。 关键问题 如何在LLMs中使用少量示例(few-shot examples)—…

网页设计相关的网站99国精产品灬源码的优势

来一个简单的例子,看Python如何操作数据库,相比Java的JDBC来说,确实非常简单,省去了很多复杂的重复工作,只关心数据的获取与操作。准备工作需要有相应的环境和模块:Ubuntu 14.04 64bitPython 2.7.6MySQLdb注…

自己建网站做那个模块好做摘抄的网站

目录 背影 摘要 代码和数据下载:基于长短期神经网络lstm的求解方程资源-CSDN文库 https://download.csdn.net/download/abc991835105/87657743 LSTM的基本定义 LSTM实现的步骤 基于长短期神经网络lstm的求解方程 结果分析 展望 参考论文 背影 方程求解,为提高精度,本文用L…

升级网站温州建站程序

http://www.cnblogs.com/itech/archive/2012/05/15/2502284.html转载于:https://www.cnblogs.com/zengkefu/p/5529576.html

药品招商网站大全一般人做不了咨询顾问

一、需求 在项目启动时,自动新建数据表 二、实现思路 创建触发类 实现SpringBoot的ApplicationRunner接口 编写建表语句常量 实现run方法,并在run方法中使用JDBC工具类的建表方法,传入建表语句常亮,完成建表 三、代码实现&…

网站内容建设包括wordpress安装显示英文

就按照最后一章的顺序来说吧。很多名字都不知道中文该怎么说,就直接用英文名称了。 Naive Bayesian Classifier 朴素贝叶斯分类器nb算法是通过学习样本中已经分类的条目,计算生成条目中的特性相对于类别的概率矩阵,然后根据待分类条目中特性在…

网站制作语言wordpress去除文章rss

第三届网络安全、人工智能与数字经济国际学术会议(CSAIDE 2024) 2024 3rd International Conference on Cyber Security, Artificial Intelligence and Digital Economy 第三届网络安全、人工智能与数字经济国际学术会议(CSAIDE 2024&…

唐山网站建设赫鸣科技新浪云服务器做网站

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练 Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以…

py做网站会员积分系统

文章目录 一、文本类型(字母、符号或数字字符的组合)二、整数类型三、精确数字类型四、近似数字(浮点)类型五、日期类型六、货币类型七、位类型八、二进制类型 一、文本类型(字母、符号或数字字符的组合) 在…