收藏!裸辞转型AI大模型,我的完整攻略与经验分享

本文分享裸辞转型AI大模型的成功经历,包括转行动机、系统学习准备和面试经验。强调深入理解底层原理、做好经济心态准备、针对性优化简历和保持良好心态的重要性,为想进入AI领域的人提供实用参考。


今年很重要的一个经历就是裸辞然后顺利转行到了AI大模型方向,回首过去的四个月以及更长的两年,在临近一年结束之时,稍稍记录一下还是很有必要的。

主要从三个方面做一下记录,缘起,讲一下为什么要转,准备,记录一下在裸辞前做了哪些准备,面试,记录一下面试时候的观察和经验。

为啥要转行呢?借用一句流行的话来讲,就是要去旷野自由地探索一番,寻求自己的人生价值。过去的时间,一直在按部就班地上学,工作,尤其是近一年,愈发感觉时间飞逝流淌,而我却一直近乎碌碌无为,没有创造什么有价值的东西。而AI领域我认为未来是很有想象力空间的方向,因此这是我想要转行的根源。

从催化剂上来说,目前的工作虽然薪资尚可,但相比刚入职那一年,越来越没什么新意,未来的几十年可能一直都是在重复类似的东西,再加上工作氛围相比之前差了很多,待的时间越长只会蚕食我向外探索的创造力,于是坚定了我即使裸辞也要离开的决心。

而导火索就是deepseek的爆发,我意识到了成本的大幅降低将会助推AI大模型在各行各业的落地,这个时候越早投入到这个行业越好。

综上,大概今年7月份我裸辞开始了转行之路。

虽然说是裸辞,但这只是指没有在职找到下份工作,并不是完全无准备的冲动之举。下面我就介绍一下我做的准备。

首先是AI大模型方向的知识能力准备,在大三下其实就已经接触学习AI了,只是当时是拿来主义不求甚解地应用了,没有深入理解底层的原理,研究生时本应该深入探索理解的,但因种种原因仍然未能深入;工作的两年我利用周末和节假日真正深入学习总结了其内部的原理,并升级了自己的学习方法,就是跟着问题学,不害怕遇到问题,在解决问题中更加深入地理解;有了这些做基础,裸辞后我又给自己设定了三个月的探索时间,自己制定了一个学习框架,更加系统学习总结AI大模型的底层原理,包含python,传统AI,主流大模型,因为我想做的方向是AI落地应用,因此做了一个落地的应用项目。而且在此期间,我在网上分享了自己的学习笔记,一方面是督促自己稳步地学习,另一方面也是保持和外部的连接,这些学习笔记现在也都放到了github上了,后面我也会继续更新优化,这也算是我创造的第一个有价值的东西了。想要学习的可以看一下,大概率会有助于学习进程。

另一方面的准备则是我对三个月探索期的准备,包括但不限于下面几个。首先最重要的是经济,工作两年也算是攒了一些,可以保证我不用担心探索期间没有收入来源的问题;第二个就是心态,虽然已经做好了准备并制定了详细的规划,但毕竟是从稳定运行了很长时间的轨道跳到旷野中,面对很高的不确定性,是会有相对来说较高的焦虑情绪的,而我应对不确定性情绪的方法,就是每天记录自己完成的任务,同时保持和外部的连接;第三个是环境,裸辞还是尽量不要一个人待在房间里,我住的地方附近有一个图书馆,我每天基本上准时早上去,晚上回,陪伴我度过了孤独的探索期。好的环境一方面保持正常学习生活节奏可以提高学习效率,另一方面也是保持和外部的连接。

经过了大概三个月的探索学习,开始了转行的面试阶段。当前的就业大环境确实整体上感觉是寒冬的,不过大环境里面又有小气候,AI大模型领域作为新兴的一个方向,国家还有企业都在往AI方向去转,所以这个方向的岗位相对来说热度是比较高的。

大环境是一方面,核心还是自己的优劣势,面试之前我先分析了一下自己的优劣势,并设定了自己的结果预期,注意不是单个面试的结果预期,而是找工作的预期,因为单个面试,单个企业的不确定性太高了。

优势首先是有两年的行业工作经验,这可以契合AI和行业的结合这一个方向,因为我初衷就不是要做基座模型的,而是要做应用的,有行业经验在我看来是一个优势,而且更重要的是,即使最后找不到AI方向,也可以在继续在本行业,这在我的预期中属于保底操作;这里多说一句,我发现,找下一份工作的经验年限在2-3年似乎为最佳,不知道是否为真?

第二个优势就是经过探索期,我真正深入从底层理解了AI大模型的原理,并拥有了一个落地项目,后者可以帮助我过一下简历初筛,前者则是在我面试的时候几乎不会像只背八股那样轻易被问住,事实上,后面的面试证明了在原理方面基本上我都可以应对,即使不熟悉的,也可以推理一下。

另一个优势则是相对不错的学历,这可以帮助我过简历初筛,在当前这个环境中,还是很有必要的。

最大的劣势则是工作匹配度的问题,现在几乎所有的社招岗位都是要求工作经历非常匹配,把你上份工作经验能够直接用到现在的工作中,而我缺少AI方面的直接工作经验,虽然自己做了一个落地项目,但这方面确实是最大的劣势。

另一个劣势则是手撕代码的能力退步很大,因为长期没有刷了。事实上也是前期的一个面试中,原理应用啥的聊得都挺好的,面试官非常好地特意选了简单的代码题,但我还是没有做出来,很是遗憾。然后我就抽了一周左右的时间,把之前刷的代码题目回顾总结了一下,后面基本上都能写出来或者说出思路了。

接下来就是密集的面试时间了,其实在面试之前我还制定了一个分行业,分岗位的面试投递节奏,不过真实执行的时候还是因为种种原因没能完全按计划进行,一揽子海投了,这是可以优化的地方。

10月20号我认为探索期虽然还没有尽善尽美,但已经可以结束投简历了,花了大概一周左右的时间投了几家小公司并把我的简历完善了一下,27号正式开始海投,中间就是漫长的面试环节,列出来的这些天,几乎每天都有两到三场面试,11月20号拿到了首个正式的书面通知offer,其实前面也有一些口头的offer,但是有的是方向岗位不匹配,有的可能是公司计划有变动,后续也没消息了(这里稍稍吐槽一下,这种变动HR通知一下给人感受会好很多的),接下来的几天也陆续得到了之前面试的几个offer,我觉得差不多了,也有两个相对来说比较合适的offer,所以10月26号就停止了面试,休息了大概两周左右的时间12月8号就正式入职了。这是我的一个面试时间线,不过企业招聘时间应该是有黄金期的,金三银四,金九银十,现在环境来说也可能是有变化的,就不确定了。

面试经验的总结来说,我觉得第一点对面试的内容是真正搞懂底层的原理了,真正系统的理解了,这个我觉得是非常重要的,这样才可以从容自信地面对每一场面试,不会像只背八股押题那样,会焦虑担心。

另外一个就是要很熟悉简历上的内容,前期可以提前准备可能的一些问题,比如说借助AI,让它根据你的简历内容去问一些问题,然后准备相应的回答,后面面试多了,每一次都要复盘面试的问题,因为面试官他都是根据你的这个简历内容来去问你的,所以很多情况下很多面试官问的内容几乎是大差不差的,越到后面越想是在背诵答案了一样。

另外还有非常值得注意的是心态,尤其是裸辞期间的面试,因为一般面试的周期拉的比较长,一周两周都是有可能的,再加上HR很多时候不会告知你结果,以及面试失败的沮丧,都会不断让人焦虑的,所以制定一个面试总的预期,不要过度关注某场面试,某家公司,面试结果不是对你个人的否定,只是不适合罢了,只要最后的结果符合预期就行了。

另外就是简历一定要好好写,可以根据想去的岗位和行业写不同的简历,把岗位描述上的关键词尽可能和自己的简历内容融合到一起,因为筛选简历的时候很多情况是看关键词匹配的。还有就是现在要求岗位匹配度,所以不要一份简历投所有的岗位。

回过头来看,这次的最终结果在我预期的第二层级,AI方向的深入探索也才刚刚开始,希望自己能够创造出有价值的东西。以上就是我的一个转行记录了,如果能对你有所帮助那再好不过了。

学习大模型 AI 如何助力提升市场竞争优势?

随着新技术的不断涌现,特别是在人工智能领域,大模型的应用正逐渐成为提高社会生产效率的关键因素。这些先进的技术工具不仅优化了工作流程,还极大地提升了工作效率。然而,对于个人而言,掌握这些新技术的时间差异将直接影响到他们的竞争优势。正如在计算机、互联网和移动互联网的早期阶段所展现的那样,那些最先掌握新技术的人往往能够在职场中占据先机。

掌握 AI 大模型技能,不仅能够提高个人工作效率,还能增强在求职市场上的竞争力。在当今快速发展的技术时代,大模型 AI 已成为推动市场竞争力的重要力量。个人和企业必须迅速适应这一变化,以便在市场中保持领先地位。

如何学习大模型 AI ?

在我超过十年的互联网企业工作经验中,我有幸指导了许多同行和后辈,并帮助他们实现个人成长和学习进步。我深刻认识到,分享经验和知识对于推动整个行业的发展至关重要。因此,尽管工作繁忙,我仍然致力于整理和分享各种有价值的AI大模型资料,包括AI大模型入门学习思维导图、精选学习书籍手册、视频教程以及实战学习等内容。通过这些免费的资源,我希望能够帮助更多的互联网行业朋友获取正确的学习资料,进而提升大家的技能和竞争力。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、初阶应用:建立AI基础认知

在第一阶段(10天),重点是对大模型 AI 的基本概念和功能进行深入了解。这将帮助您在相关讨论中发表高级、独特的见解,而不仅仅是跟随他人。您将学习如何调教 AI,以及如何将大模型与业务相结合。

主要学习内容:

  • 大模型AI的功能与应用场景:探索AI在各个领域的实际应用
  • AI智能的起源与进化:深入了解AI如何获得并提升其智能水平
  • AI的核心原理与心法:掌握AI技术的核心概念和关键原理
  • 大模型应用的业务与技术架构:学习如何将大模型AI应用于业务场景和技术架构中
  • 代码实践:向GPT-3.5注入新知识的示例代码
  • 提示工程的重要性与核心思想:理解提示工程在AI应用中的关键作用
  • Prompt的构建与指令调优方法:学习如何构建有效的Prompt和进行指令调优
  • 思维链与思维树的应用:掌握思维链和思维树在AI推理和决策中的作用
  • Prompt攻击与防范策略:了解Prompt攻击的类型和如何进行有效的防范


    、、、

二、中阶应用:深入AI实战开发

在第二阶段(30天),您将进入大模型 AI 的进阶实战学习。这将帮助您构建私有知识库,扩展 AI 的能力,并快速开发基于 agent 的对话机器人。适合 Python 和 JavaScript 程序员。

主要学习内容:

  • RAG的重要性:理解RAG在AI应用中的关键作用
  • 构建基础ChatPDF:动手搭建一个简单的ChatPDF应用
  • 检索基础:掌握信息检索的基本概念和原理
  • 理解向量表示:深入探讨Embeddings的原理和应用
  • 向量数据库与检索技术:学习如何使用向量数据库进行高效检索
  • 基于 vector 的 RAG 实现:掌握基于向量的RAG构建方法
  • RAG系统的高级扩展:探索RAG系统的进阶知识和技巧
  • 混合检索与RAG-Fusion:了解混合检索和RAG-Fusion的概念和应用
  • 向量模型的本地部署策略:学习如何在本地环境中部署向量模型

三、高阶应用:模型训练

在这个阶段,你将掌握模型训练的核心技术,能够独立训练和优化大模型AI。你将了解模型训练的基本概念、技术和方法,并能够进行实际操作。

  • 模型训练的意义:理解为什么需要进行模型训练。
  • 模型训练的基本概念:学习模型训练的基本术语和概念。
  • 求解器与损失函数:了解求解器和损失函数在模型训练中的作用。
  • 神经网络训练实践:通过实验学习如何手写一个简单的神经网络并进行训练。
  • 训练与微调:掌握训练、预训练、微调和轻量化微调的概念和应用。
  • Transformer结构:了解Transformer的结构和原理。
  • 轻量化微调:学习如何进行轻量化微调以优化模型性能。
  • 实验数据集构建:掌握如何构建和准备实验数据集。

四、专家应用:AI商业应用与创业

在这个阶段,你将了解全球大模型的性能、吞吐量和成本等方面的知识,能够在云端和本地等多种环境下部署大模型。你将找到适合自己的项目或创业方向,成为一名被AI武装的产品经理。

  • 硬件选型:学习如何选择合适的硬件来部署和运行大模型AI。
  • 全球大模型概览:了解全球大模型的发展趋势和主要玩家。
  • 国产大模型服务:探索国产大模型服务的优势和特点。
  • OpenAI代理搭建:学习如何搭建OpenAI代理以扩展AI的功能和应用范围。
  • 热身练习:在阿里云 PAI 上部署 Stable Diffusion
  • 本地化部署:在个人计算机上运行大型模型
  • 私有化部署策略:大型模型的内部部署方法
  • 利用 vLLM 进行模型部署:高效部署大型模型的技术
  • 案例分析:如何在阿里云上优雅地私有部署开源大型模型
  • 开源 LLM 项目的全面部署:从零开始部署开源大型语言模型
  • 内容安全与合规:确保AI应用的内容安全和合规性
  • 算法备案流程:互联网信息服务算法的备案指南

通过这些学习内容,您不仅能够掌握大模型 AI 的基本技能,还能够深入理解其高级应用,从而在市场竞争中占据优势。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你无疑是AI领域的佼佼者。然而,即使你只能完成60-70%的内容,你也已经展现出了成为一名大模型AI大师的潜力。

最后,本文提供的完整版大模型 AI 学习资料已上传至 CSDN,您可以通过微信扫描下方的 CSDN 官方认证二维码免费领取【保证100%免费】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1131418.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

个性化旅游行程规划系统-计算机毕业设计源码+LW文档

摘要 随着人们生活水平的提高和旅游需求的日益增长,旅游已成为人们放松身心、拓展视野的重要方式。然而,在旅游过程中,行程规划、费用管理、信息分享等方面的问题也逐渐凸显。传统的旅游管理方式存在效率低下、信息不及时等问题,难…

北大团队创新方案:CKDA框架解决跨模态行人重识别的持续学习痛点

北大团队提出CKDA框架,解决跨模态行人重识别中的持续学习灾难性遗忘问题。该框架通过跨模态通用提示生成器提取共享特征,单模态专用提示生成器保留模态特有信息,以及跨模态知识对齐引擎防止遗忘。实验表明,该框架在四个主流数据集…

2026年--Lc333-328. 奇偶链表(链表)--java版

1.题目2.思路 原地重排链表: odd.nexteven.next:跳过偶数,把下一个奇数连起来 even.nextodd.next:跳过奇数,把下一个偶数连起来 最后把奇数链尾接回 evenHead 3.代码实现 /*** Definition for singly-linked list.* pu…

AI会取代前端吗?2026年前端发展路线图,建议收藏学习

AI无法完全取代前端开发,因缺乏人类的逻辑、沟通和创新能力。前端工作不仅是写代码,还包括与多团队协作。当前前端行业竞争激烈,要求不断提高,但仍有发展空间。前端工程师可考虑向管理、架构师或讲师方向发展,或继续深…

牛批了,桌牌台签神器,批量制作

在日常开会的时候,往往需要制作桌牌台签,排版和格式校对等问题也是非常头疼的。今天给大家推荐一款桌牌台签打印神器,能够快速高效的制作各种类型的桌牌,非常方便,有需要的小伙伴可以下载收藏。 桌牌台签打印 一键制作…

MySQL 数据库连接数查询、配置

MySQL 数据库的连接数是指同时与 MySQL 数据库建立的客户端连接数量。连接数与 MySQL 的性能密切相关,需要根据实际需求和服务器资源进行合理配置和优化。 1. 查看连接数1.1. 查看当前会话连接数 SHOW STATUS LIKE ‘Threads_connected’; 1.2. 查看历史最大连接数 …

MySQL5.7.44-winx64版本Windows Server下载安装教程图解

1、下载MySQL5.7.44安装包,MySQL :: Download MySQL Community Server (Archived Versions) 2、解压到D:mysql-5.7.44-winx64 目录下(这个可以根据需要自行调整),解压后在根目录下创建my.ini和data文件夹。 [mysql] # 设置 my…

AI Agent记忆系统大揭秘:从“失忆“到“长记性“的进化之路(附代码实战)

本文详解AI Agent的记忆系统,分短期记忆与长期记忆两部分。短期记忆介绍3种优化策略(缩减法、卸载法、隔离法)及框架代码实现;长期记忆解析信息提取、向量存储、关系推理等技术,并提供Mem0/ReMe集成代码。展望记忆即服务、精细化管理、多模态…

MySQL 数据库基础

目录 什么是数据库 数据库分类 关系型数据库 非关系型数据库 SQL子语言 MySQL MySQL 存储数据的组织方式 数据库操作 显示当前数据库 创建数据库 使用数据库 删除数据库 什么是数据库 数据库 是一个用于存储、管理和检索数据的系统,可以组织和保存大量…

基于python大数据的协同过滤音乐推荐系统

博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…

K8S网络和基本命令 【 K8S (二)】

目录 一、Flannel 的核心基础(通信前的准备) 二、Flannel 的三种核心通信模式 场景 1:同节点内 Pod 通信(无需 Flannel 隧道) 场景 2:跨节点 Pod 通信(Flannel 核心) 模式 1&…

MySQL 的 INSERT(插入数据)详解

MySQL 的 INSERT(插入数据)详解 在 MySQL 中,INSERT 语句用于向数据库表中添加新的记录。INSERT 语句非常灵活,支持多种语法形式,可以根据具体需求选择合适的用法。以下是 INSERT 语句的详细语法和使用示例。 1. 插入单…

MySQL 篇 - Java 连接 MySQL 数据库并实现数据交互

在现代应用中,数据库是不可或缺的一部分。Java 作为一种广泛使用的编程语言,提供了丰富的 API 来与各种数据库进行交互。本文将详细介绍如何在 Java 中连接 MySQL 数据库,并实现基本的数据交互功能。 一、环境准备 1.1 安装 MySQL 首先&am…

基于BS架构的积分制零食自选平台-计算机毕业设计源码+LW文档

摘要 本文介绍了一个基于BS(Browser/Server,浏览器/服务器)架构的积分制零食自选平台的设计与实现。该平台旨在为用户提供一个便捷、个性化的零食购物体验,并通过积分制度激励用户的消费行为。平台的前端采用HTML、CSS和JavaScrip…

MySQL 查看有哪些表

在 MySQL 数据库中,要查看某个数据库中有哪些表,你可以使用以下几种方法: 方法一:使用 SHOW TABLES 命令连接到 MySQL 服务器: 首先,你需要使用 MySQL 客户端工具(如 mysql 命令行工具、MySQL W…

【收藏级】揭秘Claude Research:构建高性能多智能体AI系统的实战经验

Anthropic介绍了Claude Research功能的多智能体系统架构,由主导智能体协调多个并行子智能体完成复杂研究任务。该系统在开放式问题处理上表现优异,性能较单智能体提升90.2%。文章详细阐述了系统架构、执行流程、提示工程原则、评测方法及生产环境中的挑战…

基于python深度学习的面部表情识别系统

博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…

ChatGPT推出健康模式:结合医疗数据提供个性化建议

OpenAI希望确保用户从ChatGPT获得的医疗信息尽可能准确。每天约有4000万人依赖ChatGPT获取医疗问题的答案。作为回应,OpenAI宣布推出ChatGPT Health,这是ChatGPT中一个专门围绕健康和保健的"专用体验"。该功能将使用户能够将医疗记录和可穿戴设…

宠物走失信息管理系统-计算机毕业设计源码+LW文档

摘要 随着新世纪无纸化办公方式的普及,自动化信息处理和基于网络的信息交互方式已被广泛应用。现在很多行业基本上都是交由计算机进行管理和测试,网络与计算机已成为整个线上管理体系中的重要组成部分。虽然信息技术广泛应用和数据存取更加方便&#xff…

【滤波跟踪】基于 EKF的姿态角估计实战(核心是融合 IMU 传感器数据,通过四元数建模实现 RollPitchYaw 姿态估计)matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页:Matlab科研工作室 👇 关注我领取海量matlab电子书和数学建模资料 &#x1…