腾讯视频 2025届暑期实习 自然语言处理/LLM (已OC)

文章目录

  • 写在前面
  • 一面 2024/3/28 晚上19:00-20:00
  • 二面 2024/4/9 下午16:30-17:50
  • 三面/HR面 2024/4/17 下午16:30-16:50

写在前面

  1. 学校情况:2本9硕,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习,也算是转行成功了
  2. 论文情况:2A1B均为一作,其中1A(NeurIPS)+1B(ICDM)已发表,另有1A刊在投
  3. 实习情况:一段快手推荐算法日常实习

一面 2024/3/28 晚上19:00-20:00

  1. 首先是一个自我介绍
  2. 让讲两个拿手的东西,第一个首先介绍了NeurIPS那篇论文
  3. 中间穿插着问了10多个问题,包括具体原理,数据集规模,下游任务等
  4. 第二讲了快手的实习,主要干了些什么,中间穿插着10来个问题,面试官显然也了解GNN,因此这两部分耽误的时间较久
  5. 问我主要是搞GNN这块的,是怎么接触到大模型的,我说本科搞时序预测的,比较相关,再加上比较感兴趣
  6. 接下来是大模型八股拷打
  7. 说一下Transformer的具体结构,以机器翻译为例,说了编码器和解码器的工作步骤,包括训练和测试
  8. BERT和GPT的区别在哪里?从结构上说了一些,然后从BERT的任务说了一些(MLM和NSP)
  9. GPT和其他常见的大模型,比如LLaMA还有ChatGLM的区别在哪里?从结构,激活函数,位置编码以及训练的任务四个角度说了一下
  10. 预训练微调了解吗,提了一嘴LoRA
  11. 说了一下LoRA的具体原理,以及具体是用在什么地方
  12. LLaMA-70B这样的模型,加载不进去,该怎么训练呢?我从模型并行说了一下,顺便讲了数据并行
  13. GNN和LLM有没有什么好的结合方式,思路是类似把节点当做token,然后把节点序列送入LLM,然后又讲了讲当出现新的节点时可能会怎么处理
  14. 算法题:一个数值不重复的序列,每次插入一个值,如果该值存在,则将其移动到末尾,否则插入到末尾,要求O(1)时间复杂度。这题类似于LRU,用了哈希+双向链表,哈希存储值和node的映射
  15. 能实习多久,什么时候到岗?
  16. 反问:实习生进去后主要做了些什么

二面 2024/4/9 下午16:30-17:50

  1. 自我介绍
  2. 讲解NeurIPS论文,问了大概十几个问题,从动机,到细节,再到实验,让直接打开论文讲
  3. 讲解ICDM论文,问了大概十几个问题
  4. 讲一下对大模型的理解,从上个世纪的词频统计等方法,再到skip-gram,再到rnn,再到Transformer,再到BERT,再到GPT,再到一些有监督微调方法如LoRA,还有强化学习
  5. BERT和GPT有什么区别?
  6. 各有什么优势?
  7. 为什么BERT更适合做文本理解,GPT适合做生成任务
  8. 谈谈你对强化学习在LLM中的理解
  9. 图神经网络中一般用什么norm,why
  10. norm的作用,各种,追问了很多,感觉回答得不是特别好
  11. 算法题:m * n的格子,从左上角到右下角有多少条路径,需要将格子中的障碍物避开,二维DP
  12. 反问:进去主要做些什么,面试官谈了大概十多分钟
  13. 问了offer的情况,以及能实习多久,大概多久来

三面/HR面 2024/4/17 下午16:30-16:50

  1. 自我介绍
  2. 问有没有深造的打算
  3. 问到了职业规划
  4. 具体说了一下实习经历,包括做了什么
  5. 实习中具体是自己一个人在做吗?还有什么可以提升的地方吗?
  6. 你觉得自己的优缺点是什么?有什么的爱好和兴趣?优缺点描述完后问了MBTI
  7. 为什么会想到做公众号?一般做什么方向的?后续对这个公众号有更具体的规划吗
  8. 你一般通过什么来了解你这个领域的前沿技术?论文和学术交流
  9. 进去后具体想要做什么方向有规划吗?城市意向
  10. offer情况,什么时候能入职,入职后能待多久,能一直实习下去吗?
  11. 确认了一下个人信息
  12. 反问环节:具体进去做什么,HR说需要和mentor沟通

20分钟后收到了云证通知,状态也变成了录用评估中,4.20 OC,告知下周给offer

我每次面试刚结束,都会赶紧记录一下面试中的问题,因此上面写的基本就是比较完整的面试过程了,有没有涉及到的可以在评论区问我

最后祝愿大家都能拿到理想的offer!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/826712.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于SpringBoot+Vue七匹狼商城系统的设计与实现

系统介绍 近年来随着社会科技的不断发展,人们的生活方方面面进入了信息化时代。计算机的普及,使得我们的生活更加丰富多彩,越来越多的人使用通过网络来购买各类的商品。早期商品的销售和购买都是通过实体店,这种购买方式需要耗费…

分析和比较深度学习框架 PyTorch 和 Tensorflow

🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 深度学习作为人工智能的一个重要分支,在过去十年中取得了显著的进展。PyTorch 和 TensorFlow 是目前最受欢迎、最强大的两个深度学习框架,它们各自拥有独特的特点和优势。 1. Py…

网络编程学习——IO多路复用

目录 ​编辑 一,多路复用 1,IO的分类 2,IO的效率 二,Linux环境下实现通信的多路复用 1,select select的特点: 参数: 操作函数: 返回值: 使用select实现网络通信…

B树和B+树试题解析

一、单项选择题 01.下图所示是一棵(A ). A.4阶B树 B.3阶B树 C.4阶B树 D.无法确定 02.下列关于m阶B树的说法中,错误的是( C ). A.根结点至多有m棵子树 B.所有叶结点都在同一层次上 C.非叶结点至…

JAVAEE——IP协议

文章目录 IP协议IP协议报头格式IP协议报头的各个区段四位版本四位首部长度八位服务类型16位总长度16位标识,3位标志,13位片偏移八位生存时间八位协议 地址管理IP地址解决提议1:动态分配Ip地址解决提议2:NAT机制 IP协议 IP协议报头…

超越GPT-4V,苹果多模态大模型上新,神经形态计算加速MLLM(二)

上文介绍基于MINOnets神经网络架构加速多模态大模型的策略,本文将以Spinnaker2多核神经网络芯片EGRU架构为起点,覆盖存内计算架构,介绍新型计算架构在加速大模型推理的作用。SpiNNaker 2是一个设计用于大规模异步处理的多核神经形态芯片&…

openGauss学习笔记-267 openGauss性能调优-TPCC性能调优测试指导-网络配置-网卡多中断队列设置

文章目录 openGauss学习笔记-267 openGauss性能调优-TPCC性能调优测试指导-网络配置-网卡多中断队列设置267.1 操作步骤 openGauss学习笔记-267 openGauss性能调优-TPCC性能调优测试指导-网络配置-网卡多中断队列设置 本章节主要介绍openGauss数据库内核基于鲲鹏服务器和openE…

T3BI T3BI RS-232通讯操作指南与培训PPT课件

T3BI T3BI RS-232通讯操作指南与培训PPT课件

Python连接Oracle数据库问题解决及Linux服务器操作知识

背景说明 最近在做一个视频分析的项目,然后需要将视频分析的数据写入到oracle数据库,直接在服务器上测试数据库连接的时候出现了这个bug提示,自己通过不断的研究探讨,最终把这个问题成功进行了解决,在这里进行一下记录…

701强连通分量(python)

看见题目知道时间复杂度不超过(mlogm)。 这题用强连通分量 Tarjan 算法,强联通:对于任意两个点u和v,u可以到达v,v也可以到达u。这题需要考虑有重边,自环,同样别忘记可能会有两个点u…

Linux 操作系统编译器、静态库、动态库

1、编辑器 1.1、vim的安装 指令:sudo apt-get install vim 1.2 vim的使用 格式:vim 文件名 如果文件存在,只打开,文件不存在,创建并打开 vim的4中模式: 命令模式,插入模式,底行模…

Excel数据处理:高级筛选、查找定位、查找函数(VLOOKUP)

高级筛选 先去选中筛选区域 如果筛选的条件在同一行那么就是且的关系 如果筛选的条件不在同一行那么就是或的关系 查找定位空值 使用VLOOKUP函数

渗透测试入门教程,从零基础入门到精通(非常详细)

目录 什么是渗透测试 渗透测试的重要性 渗透测试的前置技能 开始入门学习路线 什么是渗透测试 渗透测试,通常被视为模拟黑客的一种安全评估行为,其目的在于全面挖掘目标网站或主机的潜在安全漏洞。与真实的黑客攻击不同,渗透测试旨在发现…

Spring定时器 Cron表达式的用法

前言 Cron表达式是一种用于描述定时任务执行时间的字符串格式,这种表达式基于时间字段来定义任务应该在哪些时间点执行,通常包含六个或七个用空格隔开的字段,分别代表秒、分钟、小时、日期、月份和星期(年份是可选的)…

系统架构最佳实践 -- 相关JAVA架构

1. java 类加载器架构 2. JVM 架构 3. Java 技术体系 4. 线程运行架构 5. Java 体系(编译与运行)结构 6. JMS 技术架构 7. JMX 技术架构 8. Spring 架构 9. Hibernate 架构 10. ibatis 架构 11. Struts2 架构 12. Struts1 架构 13. JBPM 14. EJB 技术架构…

万字总结!Docker简介及底层关键技术剖析

本文首发在个人博客上:万字总结!Docker简介及底层关键技术剖析 Docker 简介 Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中&#x…

滚动条详解:跨平台iOS、Android、小程序滚动条隐藏及自定义样式综合指南

滚动条是用户界面中的图形化组件,用于指示和控制内容区域的可滚动范围。当元素内容超出其视窗边界时,滚动条提供可视化线索,并允许用户通过鼠标滚轮、触屏滑动或直接拖动滑块来浏览未显示部分,实现内容的上下或左右滚动。它在保持…

补档 -- 测试的分类(1)

最近有很多人私信我说: 灰灰你什么时候写测试分类阿, 本来我要开始肝性能测试的, 我一看, 奥, 之前摸鱼忘写了, 所以这里补档(叶问指着一边笑.jpg). 总览 标红的需要注意一下. 为什么要对软件测试进行分类? 软件测试是软件生命周期的一个重要环节, 具有较高的复杂性, 对于软…

排序 “叁” 之交换排序

目录 1. 基本思想 2.冒泡排序 2.1 基本思想 2.2 代码示例 2.3 冒泡排序的特性总结 3.快速排序 3.1 基本思想 🌵hoare版本 🌵挖坑法 ​编辑 🌵前后指针版本 ​编辑 3.2 快速排序优化 🌻三数取中法选key 3.4 快速排序…

如何在群晖NAS部署office系统办公服务并实现无公网IP远程编辑文件

文章目录 本教程解决的问题是:1. 本地环境配置2. 制作本地分享链接3. 制作公网访问链接4. 公网ip地址访问您的分享相册5. 制作固定公网访问链接 本教程解决的问题是: 1.Word,PPT,Excel等重要文件存在本地环境,如何在编…