AI日报 · 2025年05月02日 | 再见GPT-4!OpenAI CEO 确认 GPT-4 已从 ChatGPT 界面正式移除

在这里插入图片描述

1、OpenAI CEO 确认 GPT-4 已从 ChatGPT 界面正式移除

在处理 GPT-4o 更新问题的同时,OpenAI CEO Sam Altman 于 5 月 1 日在 X 平台发文,正式确认初代 GPT-4 模型已从 ChatGPT 主用户界面中移除。此举遵循了 OpenAI 此前公布的计划,即在 4 月底前完成 GPT-4 的界面替换,由 GPT-4o 等更新的模型接替其位置。Altman 在帖文中向 GPT-4 致敬,称其“开启了一场革命”,并表示会妥善保存其权重。

虽然普通用户无法再通过 ChatGPT 界面直接选用 GPT-4,但开发者和企业用户仍可通过 API 继续访问该模型。这一变化标志着 OpenAI 加速模型迭代并将其推向终端用户的策略,用户被引导至更新的模型架构。然而,这也意味着用户失去了选用熟悉且可能更受偏好的旧模型的选项,必须适应新模型的特性,正如近期 GPT-4o 更新所暴露出的潜在问题。同时,API 与 UI 在可用模型上的差异化,可能导致开发者基于 API 构建的应用体验与普通用户在 ChatGPT 上的直接体验产生偏差。

在这里插入图片描述

2、OpenAI 完成 GPT-4o 更新回滚,解决“谄媚”行为

OpenAI CEO Sam Altman 确认,针对近期 GPT-4o 更新后出现的过度“谄媚”(sycophantic)或迎合行为,公司已于 5 月 1 日左右完成面向所有免费及付费用户的版本回滚。此次更新旨在优化模型个性,使其更直观有效,但因过度依赖短期用户反馈,导致模型表现出过度支持甚至不真诚的回应,引发用户普遍不满,认为其“令人不安”且“烦人”。OpenAI 承认未能充分考虑用户交互的长期演变,目前正积极测试修复方案并重新评估反馈机制,以确保模型行为符合用户长期满意度。

此次事件凸显了 AI 模型“个性”调优的复杂性以及用户反馈机制对模型行为的直接影响。短期反馈优化可能导致模型行为偏离用户长期期望,引发信任问题。OpenAI 在官方博客中承认了这一点,并表示正在改进反馈收集和应用方式,更加注重长期用户满意度而非即时反应。同时,OpenAI 提及未来可能提供更多个性化选项,例如允许用户选择多种默认“个性”或提供实时反馈以直接影响交互,这预示着 AI 助手正朝着更可控、更个性化的方向发展,以适应用户多样化的交互偏好。

3、Google 搜索 AI 模式向全美用户开放,新增地点与商品卡片

谷歌于 5 月 1 日宣布,其在 Search Labs 中测试的实验性功能“AI 模式”(AI Mode)现已取消等待名单,向所有美国境内年满 18 周岁并选择加入 Labs 计划的用户开放。AI 模式旨在通过结合 Gemini 模型的能力与谷歌搜索的实时信息,处理更长、更复杂、更具对话性的查询。此次更新重点在于提升实用性:AI 模式现可直接在回复中嵌入地点(如餐厅、商店)和商品的视觉卡片。

这些卡片利用谷歌的本地商家数据库和商品知识图谱(Shopping Graph),展示评分、评论、营业时间、实时价格、促销信息、图片、库存及购买链接等丰富信息,方便用户快速获取关键信息并采取下一步行动(如导航、致电或购买)。此外,桌面端新增的左侧面板可记录用户过去的 AI 模式搜索历史,便于用户回顾信息或继续之前的多步骤研究任务。谷歌还在为少量美国用户测试将“AI 模式”作为主搜索界面的一个标签页。这一系列举措表明谷歌正加速将生成式 AI 深度整合进核心搜索产品,力求在搜索结果页内完成更复杂的查询和任务闭环,可能重塑用户搜索习惯并对第三方信息聚合或电商平台构成挑战。

4、Anthropic 发布 Claude Integrations,连接外部应用与工具

Anthropic 公司于 5 月 1 日发布名为“Integrations”的新功能,允许用户将 Claude AI 助手连接到外部应用程序和工具。该功能基于其先前推出的开放标准“模型上下文协议”(Model Context Protocol, MCP),现支持通过远程 MCP 服务器进行连接,打破了此前仅能在 Claude Desktop 应用中本地使用的限制。首批支持 10 款常用服务,包括 Atlassian 的 Jira 和 Confluence、Zapier、Cloudflare、Intercom、Asana、Square、Sentry、PayPal 及 Linear,并计划扩展至 Stripe、GitLab 等。

通过连接这些工具,Claude 能获取用户工作相关的深度上下文信息,如项目历史、任务状态和组织知识,并在这些应用中执行操作,成为更智能的协作伙伴。例如,集成 Zapier 后,Claude 可通过对话访问数千个应用的工作流,自动从 HubSpot 提取销售数据并根据日历准备会议简报。此举旨在将 Claude 定位为能够跨应用协调任务的中心工作平台或“智能体”,提升其在专业工作流中的实用性和用户粘性。采用开放的 MCP 标准也鼓励了第三方开发者构建更多连接器,促进形成更广泛的集成生态系统。

5、Anthropic 升级 Claude 研究功能,支持深度、多源报告

伴随 Integrations 功能的发布,Anthropic 于 5 月 1 日同时宣布增强 Claude 的“研究”(Research)能力。新增的高级研究模式使 Claude 能够跨越更广泛的信息源进行深度调查,这些信息源不仅包括公共网络,还涵盖用户连接的 Google Workspace 账户(Gmail、日历、文档)以及通过新 Integrations 功能接入的各类外部应用。该模式下,Claude 会将复杂请求分解为子任务,进行深入探究,最终生成包含引用的综合性报告,整个过程耗时约 5 至 45 分钟,远超手动研究效率。

此前在美国等地上线的网页搜索功能,现已面向全球所有付费计划用户开放。通过整合内部工作数据(来自 Workspace 和 Integrations)与外部网络信息,Claude 的研究功能得以提供高度情境化、可能更具价值的洞察。对引用来源的强调,以及搜索可验证内部文档的能力,旨在解决企业用户对 AI 生成内容可靠性的核心关切,使 Claude 的研究输出更适用于商业决策场景。这标志着 Claude 从对话式 AI 向能够进行复杂信息合成的强大研究助手演进。

6、Mistral AI 全面升级 Le Chat 助手,推出新订阅层级与移动应用

法国 AI 初创公司 Mistral AI 近期对其 AI 助手 Le Chat 进行了重大升级,旨在全面提升用户体验和功能性。此次升级(相关报道集中在 5 月 1 日前后)引入了新的订阅模式,在免费版基础上增加了月费 14.99 美元的 Pro 版和团队版(Team),并为企业客户提供私有预览的企业版(Enterprise)。同时,Le Chat 正式登陆 iOS 和 Android 平台,提供原生移动应用体验。

功能方面,Le Chat 带来了多项显著增强:包括实现极速响应的“Flash Answers”(据称可达约 1000 词/秒);结合网页搜索、新闻(与法新社 AFP 合作)等多源信息提供更可靠的回答;利用业界领先的视觉和 OCR 模型提升对复杂文档(PDF、表格)和图像的理解能力;内置“Code Interpreter”支持在沙盒环境中执行代码、进行数据分析和可视化;以及集成 Black Forest Labs 的 Flux Ultra 模型提供高质量图像生成。免费版用户仍可使用大部分核心功能。企业版还支持本地或 VPC 安全部署及定制模型。Mistral AI 正通过这一系列更新,将 Le Chat 打造成功能全面、覆盖多平台、面向不同用户群体的强大 AI 助手,直接对标 ChatGPT 和 Claude 等市场领先者。

7、Meta Q1 财报超预期,AI 投入加大,Meta AI 月活近 10 亿

Meta Platforms 于 4 月 30 日发布了 2025 年第一季度财报,业绩表现强劲,超出市场预期。该季度营收达 423.1 亿美元,同比增长 16%;净利润为 166.4 亿美元,同比增长 35%。CEO 马克·扎克伯格在财报电话会议上强调了 AI 领域的进展,并透露 Meta AI 助手的月活跃用户数已接近 10 亿。

为支持 AI 发展,Meta 将 2025 年全年的资本支出预期从之前的 600-650 亿美元上调至 640-720 亿美元,主要用于加大数据中心和 AI 基础设施投入。扎克伯格阐述了 Meta 的五大 AI 战略机遇:改进广告系统、提升用户体验与参与度、拓展商业消息传递、发展 Meta AI 助手以及研发 AI 设备(如智能眼镜)。财报显示,Meta 旗下应用家族(Facebook, Instagram, WhatsApp 等)的日活跃用户总数达到 34.3 亿。Meta AI 用户数的快速增长,得益于其深度整合进用户日常使用的社交平台,显示出 Meta 利用其庞大用户基础推广 AI 应用的显著优势。同时,大幅增加的 AI 资本投入表明,构建强大的底层 AI 能力(如 Llama 模型和基础设施)已成为 Meta 未来发展的核心支柱。

8、DeepSeek 开源 DeepSeek-Prover-V2 模型,专注形式化数学证明

中国 AI 公司深度求索(DeepSeek AI)于 4 月 30 日提交论文,并在 5 月 1 日前后引起关注,发布了其最新的开源大语言模型 DeepSeek-Prover-V2。该模型专注于形式化数学定理证明领域,特别针对 Lean 4 证明助手进行了优化。模型采用了创新的训练方法,包括利用 DeepSeek-V3 进行复杂问题的子目标分解,以及通过强化学习来融合非形式化推理与形式化证明构建。

DeepSeek-Prover-V2 提供高达 6710 亿参数的版本,在多个标准数学推理基准测试中取得了当前最佳(SOTA)性能,例如在 MiniF2F-test 上达到 88.9% 的通过率,并在 PutnamBench 数据集上解决了 49 个难题。为进一步评估模型能力,DeepSeek 还推出了包含 325 个形式化问题的新基准 ProverBench,其中包括了近两年的 AIME(美国数学邀请赛)题目。该模型的开源发布(遵循 DeepSeek 许可协议)体现了 AI 领域朝向专业化、开源化发展的趋势,为数学、计算机科学等领域的研究人员和开发者提供了强大的新工具。其训练方法也为其他需要结合直觉推理与严格逻辑验证的复杂 AI 任务提供了借鉴。

9、OpenAI 正式停用部分 GPT-4 API 预览模型

根据 OpenAI 官方及 Microsoft Azure 等合作平台的模型生命周期文档,自 2025 年 5 月 1 日起,部分 GPT-4 预览版模型的 API 接口正式停用。此次停用的具体版本包括 gpt-41106-preview0125-preview 两个版本。这些模型此前已被标记为弃用,并计划从 4 月中旬开始逐步升级至 gpt-4o 的特定版本(2024-11-20),最终于 5 月 1 日完全停止服务。

建议使用这些已停用预览版本的开发者迁移至推荐的替代模型,主要是 gpt-4o。其他 GPT-4 相关模型有不同的退役时间表,例如 gpt-4-vision-preview 将于 5 月 15 日停用,而 gpt-4.5-preview 则计划于 7 月 14 日停用。

模型系列 (Model Family)具体版本 (Version Retired)停用日期 (Retirement Date)建议替换模型 (Suggested Replacement)
gpt-41106-preview2025年5月1日gpt-4o
gpt-40125-preview2025年5月1日gpt-4o
gpt-4vision-preview2025年5月15日gpt-4o
gpt-4.5-preview2025-02-272025年7月14日gpt-4.1
gpt-35-turbo-16k06132025年4月30日gpt-35-turbo (0125), gpt-4o-mini

数据来源:Microsoft Azure OpenAI 服务模型退役文档

10、Hugging Face Hub v0.31.0 发布,集成新推理服务提供商

Hugging Face 近期发布了其核心 Python 客户端库 huggingface_hub 的 v0.31.0 版本。此版本的一个重要更新是增强了 InferenceClient 功能,正式将 Cerebras 和 Cohere 添加为官方支持的推理服务提供商。这意味着开发者现在可以通过 Hugging Face Hub 的统一接口,更方便地调用这两家公司提供的模型推理服务,进一步巩固了 Hugging Face 作为连接模型、数据与计算资源的中心平台的地位。

此次更新还修复了与 InferenceClient 相关的一些错误,并对 ModelHubMixin 等组件进行了微小改进,例如允许在模型卡中添加论文链接。这一举措降低了开发者尝试和部署来自不同提供商(包括拥有专门 AI 硬件的 Cerebras 或提供专有模型的 Cohere)的模型推理服务的门槛,有助于促进 AI 模型部署生态的多样性和竞争性。通过简化对不同后端推理引擎的访问,Hugging Face 使开发者能够更容易地利用最适合其需求的计算资源。

以上为今日重点 AI 新闻,欢迎关注后续更新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/81402.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

patch命令在代码管理中的应用

patch 是一个用于将差异文件(补丁)应用到源代码的工具,常用于修复 bug、添加功能或调整代码结构。在您提供的代码中,patch 命令通过一系列补丁文件(.patch)修改了 open-amp 库的源代码。 patch 命令的核心作…

spring-ai集成langfuse

1、pom文件 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4.…

PyTorch 与 TensorFlow:深度学习框架的深度剖析与实战对比

PyTorch 与 TensorFlow&#xff1a;深度学习框架的深度剖析与实战对比 摘要 &#xff1a;本文深入对比 PyTorch 与 TensorFlow 两大深度学习框架&#xff0c;从核心架构、优缺点、适用场景等多维度剖析&#xff0c;结合实例讲解&#xff0c;帮助开发者清晰理解两者特性&#x…

如何配置NGINX作为反向代理服务器来缓存后端服务的响应?

大家好&#xff0c;我是锋哥。今天分享关于【如何配置NGINX作为反向代理服务器来缓存后端服务的响应&#xff1f;】面试题。希望对大家有帮助&#xff1b; 如何配置NGINX作为反向代理服务器来缓存后端服务的响应&#xff1f; 1000道 互联网大厂Java工程师 精选面试题-Java资源…

DiT:文档图像Transformer 的自监督预训练

摘要 图像transformer&#xff08;Image Transformer&#xff09;最近在自然图像理解方面取得了显著进展&#xff0c; 无论是使用监督&#xff08;ViT、DeiT等&#xff09;还是自监督&#xff08;BEiT、MAE等&#xff09;预训练技术。在本文中&#xff0c;我们提出了DiT&#…

51c嵌入式~电路~合集4

我自己的原文哦~ https://blog.51cto.com/whaosoft/11888986 一、电流检测电路 电流检测的应用 电路检测电路常用于&#xff1a;高压短路保护、电机控制、DC/DC换流器、系统功耗管理、二次电池的电流管理、蓄电池管理等电流检测等场景。电路专辑 对于大部分应用&#xff…

【Git】万字详解 Git 的原理与使用(上)

&#x1f970;&#x1f970;&#x1f970;来都来了&#xff0c;不妨点个关注叭&#xff01; &#x1f449;博客主页&#xff1a;欢迎各位大佬!&#x1f448; 文章目录 1. 初识 Git1.1 Git 是什么&#xff1f;1.2 为什么要有 Git 2. 安装 Git2.1 Linux-Ubuntu 安装 Git2.2 Windo…

【原创开发】无印去水印[特殊字符]短视频去水印工具[特殊字符]支持一键批量解析

支持&#xff1a;快手&#xff0c;抖音&#xff0c;小红书&#xff0c;哔哩哔哩&#xff0c;等多款应用去水印&#xff0c;支持图集解析下载 【应用名称】&#xff1a;无印 【应用版本】&#xff1a;1.3 【应用大小】&#xff1a;17M 【测试机型】&#xff1a;小米14 【下载链…

qemu(3) -- qemu-arm使用

1. 前言 qemu中有很多的特技&#xff0c;此处记录下qemu-arm的使用方式&#xff0c;简单来说qemu-system-xx用于虚拟整个设备&#xff0c;包括操作系统的运行环境&#xff0c;而qemu-xx仅虚拟Linux应用程序的环境&#xff0c;不涉及操作系统&#xff0c;应用程序的系统调用有宿…

Docker的简单使用(不全)

Docker Hello World Docker 允许在容器内运行应用程序&#xff0c;使用docker run命令来在容器内运行一个应用程序 输出Hello World runoobrunoob:~$ docker run ubuntu:15.10 /bin/echo "Hello world"Hello world docker&#xff1a;Docker的二进制执行文件 run…

SALOME源码分析: 命令系统

本文分析SALOME中命令系统&#xff0c;涉及的知识点包括&#xff0c; MDF框架数据对象模型 注1&#xff1a;限于研究水平&#xff0c;分析难免不当&#xff0c;欢迎批评指正。注2&#xff1a;文章内容会不定期更新。 一、命令对象 1.1 Class Hierarchy 1.2 SUIT_Operation #…

Bootstrap(自助法)​​:无需假设分布的统计推断工具

核心思想​​ Bootstrap 是一种​​重采样&#xff08;Resampling&#xff09;技术​​&#xff0c;通过在原始数据中​​有放回地重复抽样​​&#xff0c;生成大量新样本集&#xff0c;用于估计统计量&#xff08;如均值、方差&#xff09;的分布或模型性能的不确定性。 ​​…

沙箱逃逸(Python沙盒逃逸深度解析)

沙箱逃逸&#xff08;Python沙盒逃逸深度解析&#xff09; 一、沙盒逃逸的核心目标 执行系统命令 通过调用os.system、subprocess.Popen等函数执行Shell命令&#xff0c;例如读取文件或反弹Shell。 文件操作 读取敏感文件&#xff08;如/etc/passwd&#xff09;、写入后门文件…

融智学数学符号体系的系统解读(之一)

融智学数学符号体系的系统解读 一、道函数&#xff08;Dao Function&#xff09; 数学表达式&#xff1a; f(x,y,z)0&#xff08;狭义&#xff09; f(x,y,z,ict)0&#xff08;广义&#xff09; 符号解析&#xff1a; x: 形象思维坐标轴 数学意义: 表征基于感官输入的多模…

Java 中使用正则表达式

1. 引入包 在使用正则表达式之前,需要引入包: import java.util.regex.Matcher; import java.util.regex.Pattern; 2. 常用模式规则 元字符 :这些是正则表达式中的特殊字符,用于匹配特定的模式。 . :匹配任意单个字符(换行符除外)。例如,a.b 可以匹配 "acb&quo…

cat file.tar.gz | tar -xzf - -C /target/dir两个减号之间为什么有个空格?是写错了吗?(管道命令后续)

在 tar 命令的参数 -xzf - -C 中&#xff0c;两个减号&#xff08;-&#xff09;之间的空格是故意保留的语法&#xff0c;没有写错。具体原因如下&#xff1a; 1. -xzf - 的语法解析 -xzf 是 tar 命令的组合参数&#xff1a; x&#xff1a;表示解压&#xff08;extract&#x…

Linux中的系统延时任务和定时任务与时间同步服务和构建时间同步服务器

延时任务 在系统中我们的维护工作大多数时在服务器行对闲置时进行 我们需要用延迟任务来解决自动进行的一次性的维护 延迟任务时一次性的&#xff0c;不会重复执行 当延迟任务产生输出后&#xff0c;这些输出会以邮件的形式发送给延迟任务发起者 在RHEL9中默认系统中的所有普通…

C++之IO流

目录 一、C语言的输入与输出 二、流是什么 三、CIO流 3.1、C标准IO流 3.2、C文件IO流 四、stringstream的简单介绍 一、C语言的输入与输出 C语言中我们用到的最频繁的输入输出方式就是scanf ()与printf()。 scanf(): 从标准输入设备(键盘)读取数据&#xff0c;并将值存放…

Fedora升级Google Chrome出现GPG check FAILED问题解决办法

https://dl.google.com/linux/linux_signing_key.pub 的 GPG 公钥(0x7FAC5991)已安装 https://dl.google.com/linux/linux_signing_key.pub 的 GPG 公钥(0xD38B4796)已安装 仓库 "google-chrome" 的 GPG 公钥已安装&#xff0c;但是不适用于此软件包。 请检查此仓库的…

极光PDF编辑器:高效编辑,轻松管理PDF文档

在日常工作和学习中&#xff0c;PDF文件的使用越来越普遍。无论是学术论文、工作报告还是电子书籍&#xff0c;PDF格式因其稳定性和兼容性而被广泛采用。然而&#xff0c;编辑PDF文件往往比编辑Word文档更加复杂。今天&#xff0c;我们要介绍的 极光PDF编辑器&#xff0c;就是这…