小红书算法岗面试,面试官还是很喜欢拷打的。。。

节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。

针对大模型技术趋势、算法项目落地经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。

总结链接如下:

  • 《大模型面试宝典》(2024版) 正式发布

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们


最近小红书又准备优化员工,不知道对我们是否有影响。

这是前段时间我第一次尝试跨方向找算法岗,红书面试官还是很喜欢拷打的,会关注我这种CV多模态背景的推荐算法基础怎么样。

小红书三位面试官给我的最大启发:是否能把自己的所学,用于解决特定问题(即便不是相关背景),才是候选人身上最大的闪光点。

一面

  • 论文问了十多分钟,细问课程学习怎么设计的,怎么判断样本可靠还是不可靠,训练流程。

  • 多模态比赛细问难负样本挖掘怎么做。

  • 写一下你用到的图到文的对比学习 loss 代码。

  • 如何理解 embedding?

  • 之前了解的推荐模型有哪些?把你刚刚说的多路召回和排序模型讲一下。

  • self attention 公式写一下,定量解释一下为什么要除以根号 dk?

  • 了解哪些 loss 函数?交叉熵, triplet, hard triplet, 对比 loss,mse loss,对抗 loss,focal loss。

  • 目前主流的开源大模型体系有哪些?

  • 使用过开源大模型有哪些?

  • prefix LM 和 causal LM、encoder-decoder 区别及各自有什么优缺点?

  • 做过那些大模型的研究和实践

代码考察

一个长度为n的整数数组nums,其中nums的所有整数都在范围[1,n]内,且每个整数出现一次或两次 。

请你就找出所有出现两次的整数,请实现一个时间复杂度为O(n)且仅使用O(1)额外空间的算法。

二面

  • 自我介绍

  • 对推荐算法模型有什么了解,BST 和 SDM,介绍一下 SDM?

  • 实现一个 Conv 的代码?

  • 一层 Conv 计算的时间复杂度是多少?

  • 激活函数了解哪些? sigmoid 能用在哪些场景?

  • 为什么sin cos不能用作激活函数?

  • 二分类为啥不用 mse loss?

  • 项目里为啥会用到 GRU? 跟普通 LSTM 的差别你了解吗?

  • 讲一下 BERT 的结构,为什么 BERT 很强大?

  • BERT 的 MLM 任务为啥会有效果?

  • 大模型的幻觉问题

  • InstructGPT 三个阶段的训练过程,用语言描述出来

  • 大模型推理加速的方法

  • Deepspeed分布式训练的了解,zero 0-3的了解

  • LLM的评估方式有哪些?特点是什么?

代码考察

  • LeetCode 接雨水

  • LeetCode 最大连续子数组乘积

三面

  • 上来先写个二叉树的题目,由于树当时刷的不多,最后在面试官指导下发写出来了

  • 平时如何自学推荐算法知识?看过最近的推荐论文吗?

  • 难负样本一定有助于模型训练吗?

  • 论文中 attention 不会导致很大的训练开销吗?

  • 看做过域泛化的工作,解释一下 domain generalization 原理?为啥你的方法能 work?

  • 如果训练语料和测试存在很大 gap ,你觉得域泛化的学术方法能帮助解决吗?面试官看我洋洋洒洒介绍,笑着说工业界很多方法不喜欢花里胡哨

  • 为什么 transformer 会比 GRU 更有效?有实际对比过吗?

  • 如果能来实习,每周能出勤几天?

资料获取和交流

技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

成立了大模型算法技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流

通俗易懂讲解大模型系列

  • 重磅消息!《大模型面试宝典》(2024版) 正式发布!

  • 重磅消息!《大模型实战宝典》(2024版) 正式发布!

  • 做大模型也有1年多了,聊聊这段时间的感悟!

  • 用通俗易懂的方式讲解:大模型算法工程师最全面试题汇总

  • 用通俗易懂的方式讲解:不要再苦苦寻觅了!AI 大模型面试指南(含答案)的最全总结来了!

  • 用通俗易懂的方式讲解:我的大模型岗位面试总结:共24家,9个offer

  • 用通俗易懂的方式讲解:大模型 RAG 在 LangChain 中的应用实战

  • 用通俗易懂的方式讲解:ChatGPT 开放的多模态的DALL-E 3功能,好玩到停不下来!

  • 用通俗易懂的方式讲解:基于扩散模型(Diffusion),文生图 AnyText 的效果太棒了

  • 用通俗易懂的方式讲解:在 CPU 服务器上部署 ChatGLM3-6B 模型

  • 用通俗易懂的方式讲解:ChatGLM3-6B 部署指南

  • 用通俗易懂的方式讲解:使用 LangChain 封装自定义的 LLM,太棒了

  • 用通俗易懂的方式讲解:基于 Langchain 和 ChatChat 部署本地知识库问答系统

  • 用通俗易懂的方式讲解:Llama2 部署讲解及试用方式

  • 用通俗易懂的方式讲解:一份保姆级的 Stable Diffusion 部署教程,开启你的炼丹之路

  • 用通俗易懂的方式讲解:LlamaIndex 官方发布高清大图,纵览高级 RAG技术

  • 用通俗易懂的方式讲解:为什么大模型 Advanced RAG 方法对于AI的未来至关重要?

  • 用通俗易懂的方式讲解:基于 Langchain 框架,利用 MongoDB 矢量搜索实现大模型 RAG 高级检索方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/867234.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stream练习

运用点&#xff1a; 流内数据类型转换(map)、filter、limit、skip、concat(让两个流合并) 题目&#xff1a; 操作1、2&#xff1a; ArrayList<String> manList new ArrayList<>();ArrayList<String> womanList new ArrayList<>();Collections.addAl…

多模态MLLM都是怎么实现的(11)--从SadTalker到快手LivePortait

我之前出差带休假差不多两个礼拜吧&#xff0c;今天回北京更新一篇 我确实找到了一个有意思的东西&#xff0c;LivePortrait 这东西开源了&#xff0c;你可以认为是目前做得最好的"Sadtalker"&#xff0c;国内也有dream-talker&#xff0c;EMO之类的。 我之前看EMO的…

ETag:Springboot接口如何添加Tag

ETag简介 在Web开发中&#xff0c;ETag&#xff08;Entity Tag&#xff09;是一种HTTP头字段&#xff0c;用于标识特定版本的资源。ETag的主要用途是缓存控制和优化&#xff0c;通过比较客户端和服务器资源的ETag值&#xff0c;可以判断资源是否发生变化&#xff0c;从而避免不…

C++——模板详解(下篇)

一、非类型模板参数 模板参数分为类型形参与非类型形参。 类型形参即&#xff1a;出现在模板参数列表中&#xff0c;跟在class或者typename之后的参数类型名称。 非类型形参&#xff0c;就是用一个常量作为类&#xff08;函数&#xff09;模板的一个参数&#xff0c;在类&#…

kfree_rcu实现浅析

文章http://t.csdnimg.cn/9sS23和http://t.csdnimg.cn/0wa6h分析了rcu的基本实现原理。不过在阅读内核代码的过程中&#xff0c;我们经常能看到函数kfree_rcu()的使用。那么kfree究竟是怎么和rcu联系在一起的呢&#xff1f; 本文分析基于linux内核4.19.195 直接上代码。 /*** …

使用Java实现分布式日志系统

使用Java实现分布式日志系统 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 在分布式系统中&#xff0c;日志记录是一项至关重要的任务。它不仅用于故障排查和…

kubernetes集群部署:node节点部署和CRI-O运行时安装(三)

关于CRI-O Kubernetes最初使用Docker作为默认的容器运行时。然而&#xff0c;随着Kubernetes的发展和OCI标准的确立&#xff0c;社区开始寻找更专门化的解决方案&#xff0c;以减少复杂性和提高性能。CRI-O的主要目标是提供一个轻量级的容器运行时&#xff0c;它可以直接运行O…

Mysql--基础知识点--87--分库、分表、分区的情景

MySQL中的分库、分表和分区是数据库优化的重要手段&#xff0c;用于解决数据量增长、性能瓶颈以及高并发等问题。下面将分别说明何时进行分库、分表和分区&#xff1a; 一、分库 何时分库&#xff1a; 并发量高&#xff1a;当数据库的连接数达到上限&#xff0c;且通过调整配…

Docker学习笔记(三)Dockerfile

一、什么是Dockerfile Dockerfile 是一个用于自动化构建 Docker 镜像的文本文件&#xff0c;其中包含了从一个基础镜像开始&#xff0c;到最终形成所需定制镜像的所有指令集。这个文件中的每一条指令都对应着构建镜像过程中的一个步骤或一层&#xff0c;指导 Docker 如何安装软…

【无标题】Jenkins 配置项目打包,基于已有的项目

加粗样式 1.新建任务 德达一体化->新建任务 输入任务名称&#xff08;不可重名&#xff09;&#xff0c;下面任务类型选择复制已有的项目 2.配置任务 2-1. 描述 写该任务的描述 打包记录保存设置 2-2. 源码管理 指定Gitlab地址以及登录用户 指定分支&#xff1a; 例如&a…

PHP智慧门店微信小程序系统源码

&#x1f50d;【引领未来零售新风尚】&#x1f50d; &#x1f680;升级启航&#xff0c;智慧零售新篇章&#x1f680; 告别传统门店的束缚&#xff0c;智慧门店v3微信小程序携带着前沿科技与人性化设计&#xff0c;正式启航&#xff01;这个版本不仅是对过往功能的全面优化&a…

从GREE格力看如何起全球商标名称!

有些主体需要走出去出口到国外&#xff0c;普推商标知产老杨看到在一些海外电商平台的出售产品&#xff0c;也会需要英文商标&#xff0c;有的会申请申请注册中英结合商标&#xff0c;在国外申请注册也是比较方便。 格力开始想用“GLEE”(快乐)这个词作为商标名称&#xff0c;但…

【JavaWeb程序设计】JSP编程II

目录 一、输入并运行下面的import_test.jsp页面 1.1 代码运行结果 1.2 修改编码之后的运行结果 二、errorPage属性和isErrorPage属性的使用 2.1 下面的hello.jsp页面执行时将抛出一个异常&#xff0c;它指定了错误处理页面为errorHandler.jsp。 2.1.2 运行截图 2.2 下面…

医疗器械FDA | FDA如何对医疗器械网络安全认证进行审查?

FDA医械网络安全文件出具​https://link.zhihu.com/?targethttps%3A//www.wanyun.cn/Support%3Fshare%3D24315_ea8a0e47-b38d-4cd6-8ed1-9e7711a8ad5e FDA对医疗器械的网络安全认证进行审查时&#xff0c;主要关注以下几个方面&#xff0c;以确保医疗器械在网络环境中的安全性…

模板语句——02

模板语句的数据来源 1.谁可以给模板语句提供数据支持&#xff1f; data选项 2.data选项的类型是什么&#xff1f; Object | Function (对象或者函数) 3.data配置项的专业叫法&#xff1a;vue 实例的数据对象。&#xff08;data实际上是给整个&#xff09;vue实例提供数据的来…

2 极/2 零 (2P2Z) 补偿器

极/2 零 &#xff08;2P2Z&#xff09; 补偿器是模拟 II 型控制器的数字实现。它是一种滤波器&#xff0c;通过考虑两个极点和一个零点&#xff0c;将特定的增益和相位升压引入系统。您必须战略性地选择每个极点和零点的频率位置&#xff0c;这将有助于实现所需的系统性能。在该…

团队编程:提升代码质量与知识共享的利器

目录 前言1. 什么是团队编程&#xff1f;1.1 团队编程的起源1.2 团队编程的工作流程 2. 团队编程的优势2.1 提高代码质量2.2 促进知识共享2.3 增强团队协作2.4 提高开发效率 3. 团队编程的挑战3.1 开发成本较高3.2 需要良好的团队协作3.3 个人风格和习惯的差异3.4 长时间的集中…

[C++][CMake][生成可执行文件][下]详细讲解

目录 1.搜索文件1.aux_source_directory2.file 2.包含头文件3.变量操作1.追加1.使用set拼接2.使用list拼接 2.字符串移除3.list其他操作 4.宏定义5.预定义宏 1.搜索文件 如果一个项目里边的源文件很多&#xff0c;在编写CMakeLists.txt文件的时候不可能将项目目录的各个文件一…

大数据期末复习——hadoop、hive等基础知识

一、题型分析 1、Hadoop环境搭建 2、hadoop的三大组件 HDFS&#xff1a;NameNode&#xff0c;DataNode&#xff0c;SecondaryNameNode YARN&#xff1a;ResourceManager&#xff0c;NodeManager &#xff08;Yarn的工作原理&#xff09; MapReduce&#xff1a;Map&#xff0…

七人互助拼团模式:共创共赢的电商新篇章

在当今电商行业的繁荣浪潮中&#xff0c;七人互助拼团模式犹如一股清流&#xff0c;凭借其独特的激励机制与深厚的互助合作文化&#xff0c;赢得了消费者与商家的广泛赞誉。这一模式不仅重新定义了团购体验&#xff0c;更在无形中强化了社群间的联系与协作&#xff0c;共同绘制…