AI日报 · 2025年5月07日|谷歌发布 Gemini 2.5 Pro 预览版 (I/O 版本),大幅提升编码与视频理解能力

在这里插入图片描述

1、谷歌发布 Gemini 2.5 Pro 预览版 (I/O 版本),大幅提升编码与视频理解能力

谷歌于5月6日提前发布 Gemini 2.5 Pro 预览版 (I/O 版本),为开发者带来更强编码能力,尤其优化了前端与UI开发、代码转换及智能体工作流构建,并在WebDev Arena编码能力排行榜登顶 。其视频理解能力亦达业界领先(VideoMME得分84.8%),催生了“视频转学习应用”等创新流程 。
在这里插入图片描述

此次更新还针对开发者反馈改进了函数调用错误和触发率,旧版用户将自动升级且价格不变,确保在Google I/O前提供体验 。

2、OpenAI 斥资 30 亿美元收购 AI 编程工具 Windsurf,强化代码生成生态

据报道,OpenAI于5月6日确认以约30亿美元完成对其迄今最大的一笔收购,将AI辅助编程工具Windsurf(前身为Codeium)纳入麾下 。
在这里插入图片描述

此举旨在显著增强ChatGPT的编码功能,并使OpenAI在日益激烈的AI编程助手市场中(竞争者包括微软GitHub Copilot、Anthropic等)占据更有利位置 。此次收购标志着AI巨头正从单纯的模型能力竞争,转向构建和控制关键应用生态系统,特别是在高价值的AI编程领域 。

3、Perplexity AI 计划推出 AI 驱动的 Comet 浏览器,提供“智能体搜索”体验

Perplexity AI 计划于2025年5月推出名为Comet的AI驱动网络浏览器,旨在提供“智能体搜索”体验,挑战现有市场格局 。用户现可通过官网perplexity.ai/comet加入等候名单获取早期访问权限 。在这里插入图片描述

Comet浏览器据称将具备基于自然语言的标签页管理、上下文感知响应、原生广告拦截及可选数据共享退出等功能 。然而,其计划通过追踪用户活动提供个性化广告的模式,已引发业界对用户数据隐私的广泛讨论与审视 。

4、谷歌 Gemini 应用更新:单次提示可上传文件增至 10 个

谷歌于5月6日宣布其Gemini AI聊天机器人应用迎来重要用户体验升级:单次提示现可支持同时上传多达10个文件(如图片、文档)。此项被团队称为“痛点修复”的更新已在安卓、iOS及网页版全面铺开,并兼容Gemini 2.0 Flash至2.5 Pro等所有当前模型,显著提升了处理涉及多个来源信息查询时的便捷性与效率 。此前,Gemini每次提示仅允许上传单个文件。

5、Meta AI 独立应用详情披露:基于 Llama 4,主打个性化与社交整合

据5月6日报道,Meta近期推出的独立Meta AI应用基于其Llama 4模型,核心特性在于深度个性化与社交功能整合 。该应用支持文本与语音交互,提供图像生成编辑、网络搜索等服务,并引入“发现”信息流,鼓励用户分享和借鉴AI使用提示,增强社交互动性 。通过关联用户Facebook及Instagram账户数据,Meta AI能学习用户偏好以提供更精准的上下文响应,并将整合Ray-Ban智能眼镜功能,推进扎克伯格构想的互动式社交媒体未来 。

6、谷歌 NotebookLM 新增“音频概览”功能,将书面材料转化为 AI 对话摘要

谷歌为其AI研究和笔记工具NotebookLM于5月6日左右新增“音频概览”(Audio Overview)实验性功能 。用户可一键将上传的文档、幻灯片、图表等多种书面材料,转化为由两位AI虚拟主持人进行的“深度探讨”式音频对话 。
在这里插入图片描述

AI主持人将负责总结材料、建立主题联系并展开讨论。生成的音频内容支持下载,方便用户随时随地通过听觉方式理解和记忆复杂信息,特别适合偏好听觉学习的用户。目前该功能仍有局限,如仅支持英语 。

7、谷歌搜索结果中 AI概览占比升至13.14%,信息类查询为主但商业查询渐增

据Semrush与Datos于5月6日发布的研究报告,截至今年3月,谷歌AI概览(AI Overviews)在美国桌面搜索结果中的出现比例已攀升至13.14%,相较1月份的6.49%实现了102%的显著增长 。AI概览目前主要针对信息类查询(占88.1%),但其在商业查询(8.69%)和导航查询(1.43%)中的占比亦有所提升,尤其在科学、健康等行业增长迅速 。值得注意的是,研究初步显示AI概览的引入并未必然导致零点击搜索行为增加 。

8、OpenAI 确认保持非营利控制,营利部门转型为公益公司 (PBC)

OpenAI于5月6日确认,将放弃原先完全转为营利性公司的计划,其非营利性质的董事会将继续对商业子公司进行监督与控制 。其营利部门将从有利润上限的公司重组为一家公益公司(Public Benefit Corporation, PBC),这一结构类似于Anthropic及xAI,旨在平衡大规模融资需求与其“确保通用人工智能惠及全人类”的核心使命 。此决策是在与监管机构对话并面临包括埃隆·马斯克在内的多方压力后作出的 。

9、xAI 与 Palantir、TWG Global 联手,共同推动 AI 在金融服务领域的应用

埃隆·马斯克旗下的人工智能公司xAI于5月6日宣布,已与数据分析巨头Palantir Technologies及投资公司TWG Global达成战略合作伙伴关系 。三方将共同致力于满足金融服务行业对AI技术日益增长的需求,其中TWG Global将主导AI解决方案的设计与部署实施工作 。此次合作的核心在于将xAI的先进模型(包括Grok系列大语言模型和Colossus超级计算机)深度整合到金融机构的实际业务运营流程中 。

10、美国会议员提案欲加强AI芯片出口管制,要求追踪英伟达等芯片流向

据5月6日报道,为应对先进AI芯片可能通过非正规渠道流入中国的担忧,美国众议员Bill Foster已正式提出一项法案,旨在加强对英伟达等公司高端AI芯片的出口管制 。该法案的核心要求是,芯片制造商必须实施有效机制以追踪其芯片在售出后的实际地理位置,并确保未获得相应许可的芯片无法被激活使用 。此提案已获得两党议员支持,反映了对国家安全的共同关切,若通过可能对全球AI芯片供应链及相关企业合规成本产生深远影响 。

以上为今日重点 AI 新闻,欢迎关注后续更新。

参考资料

[1] Google AI Blog. “Gemini 2.5 Pro Preview: even better coding performance.” 访问时间 2025年5月7日. https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/

[2] DevOps.com. “OpenAI Acquires Windsurf for $3 Billion.” 访问时间 2025年5月7日. https://devops.com/openai-acquires-windsurf-for-3-billion/

[3] Business Standard. “Perplexity AI to rival Google Chrome with AI-powered web browser Comet.” 访问时间 2025年5月7日. https://www.business-standard.com/technology/tech-news/perplexity-ai-to-rival-google-chrome-with-ai-powered-web-browser-comet-125050600938_1.html

[4] Perplexity AI. “Comet Browser by Perplexity.” 访问时间 2025年5月7日. https://www.perplexity.ai/comet

[5] The Keyword. “Perplexity’s ‘Comet’ browser will track users’ data to sell “hyper-personalized” ads.” 访问时间 2025年5月7日. https://www.thekeyword.co/news/perplexitys-comet-browser-will-track-users-data-to-sell-hyper-personalized-ads

[6] LiveMint. “Google Gemini now supports uploading up to 10 files at once: Here’s how users benefit.” 访问时间 2025年5月7日. https://www.livemint.com/technology/tech-news/google-gemini-now-supports-uploading-up-to-10-files-at-once-what-it-means-for-users-11746526219597.html

[7] Indian Express. “Meta AI app: What does it mean for social media future?” 访问时间 2025年5月7日. https://indianexpress.com/article/technology/artificial-intelligence/meta-ai-app-what-does-it-mean-for-social-media-future-9985572/

[8] Google Blog. “NotebookLM now lets you listen to a conversation about your sources.” 访问时间 2025年5月7日. https://blog.google/technology/ai/notebooklm-audio-overviews/

[9] Search Engine Land. “Google AI Overviews now show on 13% of searches: Study.” 访问时间 2025年5月7日. https://searchengineland.com/google-ai-overviews-13-searches-455057

[10] Nieman Lab (citing The Verge). “OpenAI has abandoned its plan to become a for-profit company.” 访问时间 2025年5月7日. https://www.niemanlab.org/reading/openai-has-abandoned-its-plan-to-become-a-for-profit-company/

[11] WHTC (citing Reuters). “Musk’s xAI joins TWG Global, Palantir for AI push in financial sector.” 访问时间 2025年5月7日. https://whtc.com/2025/05/06/musks-xai-joins-twg-global-palantir-for-ai-push-in-financial-sector/

[12] Tribune.com.pk (citing Reuters). “US lawmaker introduces bill to curb Nvidia AI chip smuggling into China: Reuter.” 访问时间 2025年5月7日. https://tribune.com.pk/story/2544249/us-lawmaker-introduces-bill-to-curb-nvidia-ai-chip-smuggling-into-china-reuter

[13] Business Standard. “Google Gemini increases attachment limit in one prompt: Here’s the new cap.” 访问时间 2025年5月7日. https://www.business-standard.com/technology/tech-news/google-gemini-increases-attachment-limit-in-one-prompt-here-s-the-new-cap-125050600739_1.html

[14] OpenTools.ai. “OpenAI keeps mission at heart, avoids for-profit overhaul.” 访问时间 2025年5月7日. https://opentools.ai/news/openai-keeps-mission-at-heart-avoids-for-profit-overhaul

[15] Silicon.co.uk. “Elon Musk To Continue OpenAI Lawsuit – Lawyer.” 访问时间 2025年5月7日. https://www.silicon.co.uk/e-regulation/legal/elon-musk-to-continue-openai-lawsuit-lawyer-612351

[16] The Economic Times. “Is Elon Musk eyeing number one status in AI race? Check Tesla boss’ latest big artificial intelligence move.” 访问时间 2025年5月7日. https://m.economictimes.com/news/international/us/is-elon-musk-eyeing-number-one-status-in-ai-race-check-tesla-boss-latest-big-artificial-intelligence-move/articleshow/120937357.cms

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/80267.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python+ffmpeg 实现给视频添加字幕

创作灵感 孩子学校经常留作业,需要提交一段录制的视频,视频上要求添加学校、班级、姓名等信息的字幕,手机自带的相机软件字幕添加位置要么只能添加在视频正中,要么无法添加多行文本,要么只能添加在片头或者片尾&#…

OpenLayers 精确经过三个点的曲线绘制

OpenLayers 精确经过三个点的曲线绘制 根据您的需求,我将提供一个使用 OpenLayers 绘制精确经过三个指定点的曲线解决方案。对于三个点的情况,我们可以使用 二次贝塞尔曲线 或 三次样条插值,确保曲线精确通过所有控制点。 实现方案 下面是…

Django缓存框架API

这里写自定义目录标题 访问缓存django.core.cache.cachesdjango.core.cache.cache 基本用法cache.set(key, value, timeoutDEFAULT_TIMEOUT, versionNone)cache.get(key, defaultNone, versionNone)cache.add(key, value, timeoutDEFAULT_TIMEOUT, versionNone)cache.get_or_se…

Linux系统管理与编程17:自动化部署ftp服务

兰生幽谷,不为莫服而不芳; 君子行义,不为莫知而止休。 #virtual用户管理:passerbyA、captain和admin三个虚拟用户 # passerbyA只能看,captain可看读写上传,但不能删除。admin全部权限 [rootshell shell]…

2025python学习笔记

一.Python语言基础入门 第一章 01.初识Python Python的起源: 1989年,为了打发圣诞节假期,Gudio van Rossum吉多范罗苏姆(龟叔)决心开发一个新的解释程序(Python维形)1991年,第一个…

STM32单片机的快速成长路径规划

一、基础准备阶段(1-2周) C语言核心技能 重点掌握:指针操作、结构体、枚举、位操作、函数指针(回调函数基础)实践项目:通过51单片机或STM8完成LED控制、按键检测等基础项目,熟悉寄存器配置和调试…

torch.nn.init.uniform_

nn.init.uniform_ 是 PyTorch 中用于初始化张量(tensor)的一个函数,它的作用是将张量的值填充为从均匀分布中采样的随机数。 详细说明: 函数: torch.nn.init.uniform_(tensor, a0., b1.)tensor:需要被初始…

Spring MVC中跨域问题处理

在Spring MVC中处理跨域问题可以通过以下几种方式实现,确保前后端能够正常通信: 方法一:使用 CrossOrigin 注解 适用于局部控制跨域配置,直接在Controller或方法上添加注解。 示例代码: RestController CrossOrigin…

基本句子结构

以下是英语句子五种基本结构的详细解释,并附上系动词的全面分类及示例: ​1. 主谓结构(SV)​ ​结构:主语(Subject) 不及物动词(Intransitive Verb)​核心:…

游戏引擎学习第264天:将按钮添加到分析器

回顾并为今天的工作做铺垫 随着时间的推移,我们的分析器(profiler)变得越来越强大。我通常会问大家是否记得我们要做什么,今天我们要做的似乎是按钮相关的功能。 今天的目标是实现按钮功能。我们从昨天留下的地方继续&#xff0…

大节点是选择自建机房还是托管机房

选择PCDN大节点自建机房还是托管机房,需综合考量资金实力、技术能力、运维需求、业务规模及合规要求。以下为具体分析: 自建机房的适用场景与考量因素 资金与技术门槛高 自建机房需投入服务器、存储、网络设备等硬件,以及机房建设、电力、散…

【SpringBoot】SpringBoot中使用AOP实现日志记录功能

前言一、AOP基本概念二、项目准备三、实现日志记录切面1、创建自定义日志注解2、实现日志切面3、配置AOP 四、使用示例1. 在Controller中使用2. 在Service中使用 六、高级配置1. 日志内容格式化2. 异步日志记录3. 日志脱敏处理 七、代理类生成的核心逻辑问题1: 既然…

linux中的常用命令(一)

目录 常用的快捷键 1- tab键:命令或者路径提示及补全; 2-ctrlc:放弃当前输入,终止当前任务或程序 3-ctrll;清屏 4-ctrlinsert:复制 5-鼠标右键:粘贴; 6-altc:断开连接/ctrlshift r 重新连接 7-alt1/2/3/等:切换回话窗口 8-上下键…

Pycharm(十九)深度学习

一、深度学习概述 1.1 什么是深度学习 深度学习是机器学习中的一种特殊方法,它使用称为神经网络的复杂结构,特别是“深层”的神经网络,来学习和做出预测。深度学习特别适合处理大规模和高维度的数据,如图像、声音和文本。深度学习、机器学习和人工智能之间的关系如下图所…

多视图密集对应学习:细粒度3D分割的自监督革命

原文标题:Multi-view Dense Correspondence Learning (MvDeCor) 引言 在计算机视觉与图形学领域,3D形状分割一直是一个基础且具有挑战性的任务。如何在标注稀缺的情况下,实现对3D模型的细粒度分割?近期,斯坦福大学视觉…

Vue——前端vue3项目使用汉字转拼音

在 Vue3 项目中,可以通过以下 第三方 JavaScript 包 实现汉字转拼音。这些包均兼容 Vue3,且无需依赖后端处理: 推荐方案 1. pinyin-pro 特点:功能强大、支持多音字、声调、拼音匹配、轻量级(~20KB)。安装…

批量统计PDF页数,统计图像属性

软件介绍: 1、支持批量统计PDF、doc\docx、xls\xlsx页数 2、支持统计指定格式文件数量(不填格式就是全部) 3、支持统计JPG、JPEG、PNG图像属性 4、支持统计多页TIF页数、属性 5、支持统计PDF、JPG画幅 统计图像属性 「托马斯的文件助手」…

LeetCode 每日一题 2025/5/5-2025/5/11

记录了初步解题思路 以及本地实现代码;并不一定为最优 也希望大家能一起探讨 一起进步 目录 5/5 790. 多米诺和托米诺平铺5/6 1920. 基于排列构建数组5/7 3341. 到达最后一个房间的最少时间 I5/8 3342. 到达最后一个房间的最少时间 II5/9 3343. 统计平衡排列的数目5…

pytest自动化测试执行环境切换的两种解决方案

🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 一、痛点分析 在实际企业的项目中,自动化测试的代码往往需要在不同的环境中进行切换,比如多套测试环境、预上线环境、UAT环境、线上环…

visual studio 2015 安装闪退问题

参考链接: VS2012安装时启动界面一闪而过问题解决办法 visual studio 2015 安装闪退问题