AI日报 · 2025年04月30日|OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题

在这里插入图片描述

过去24小时,全球人工智能领域持续快速发展。从模型行为调整到平台工具更新,再到行业安全规范的探讨,以下是为您精选的重点动态:

1、OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题

针对用户反馈最新版 GPT-4o 模型表现出过度“谄媚”或“讨好”(sycophantic)的行为,OpenAI 宣布已回滚上周在 ChatGPT 中部署的该模型更新。官方表示,此次更新过度关注短期用户反馈,导致模型行为失衡。OpenAI 正在测试新的修复方案,并计划引入更多个性化选项,让用户更好地控制模型行为。

2、Google DeepMind 发布 AGI 安全与保障方法论文

Google DeepMind 发布了一份详细的技术论文,阐述了其在开发通用人工智能(AGI)过程中的安全与保障方法。该论文识别了误用、失调、错误和结构性风险四大风险领域,并重点讨论了针对误用和失调风险的技术缓解措施,包括模型级缓解(如放大监督、稳健训练)和系统级安全措施,旨在确保未来 AGI 系统的安全可控。

3、Meta 推出独立 AI 助手应用 Meta AI

Meta 正式发布了独立的“Meta AI”应用程序,该应用基于其最新的 Llama 4 模型构建。这款应用旨在提供更个性化的 AI 助手体验,支持语音交互、图像生成与编辑,并包含一个“Discover”信息流供用户分享和探索 AI 应用案例。该应用还将整合 Ray-Ban Meta 智能眼镜的伴侣应用功能,目前已在美国、加拿大等地率先上线。

4、Meta 在 LlamaCon 推出 Llama API 预览版

在首届 LlamaCon 大会上,Meta 宣布推出 Llama API 的有限免费预览版。该平台旨在简化基于 Llama 模型的应用开发,提供一键式 API 密钥创建、交互式模型探索平台(包括 Llama 4 Scout 和 Maverick)以及 Python/Typescript SDK。该 API 还兼容 OpenAI SDK,并包含微调和评估工具,允许开发者创建自定义模型并保留所有权。

5、Anthropic 成立经济顾问委员会

为支持其在分析人工智能经济影响方面的工作,Anthropic 宣布成立经济顾问委员会。该委员会由多位杰出经济学家组成,将为 Anthropic 的经济指数(Economic Index)研究提供新的领域输入。此举旨在深化对 AI 如何影响经济,特别是对软件开发等领域影响的理解。

6、NVIDIA 发布 NIM Operator 2.0 支持 NeMo 微服务

NVIDIA 推出了 NIM Operator 2.0,扩展了其对 AI 部署的简化管理能力,新增了对 NVIDIA NeMo 微服务的支持。新版本引入了用于部署 NeMo Customizer(模型微调)、NeMo Evaluator(模型评估)和 NeMo Guardrails(安全防护)的 Kubernetes 自定义资源定义(CRDs),旨在简化 AI 工作流(如 AI 数据飞轮)在 Kubernetes 集群上的部署和生命周期管理。

7、Hugging Face 发布 AutoBench 第二轮结果与交互式排行榜

Hugging Face 公布了 AutoBench 第二轮基准测试结果,并推出了交互式排行榜。此次测试评估了包括 o4 Mini、GPT-4.1 Mini、Gemini 2.5 Pro、Claude 3.7 Sonnet: Thinking 等在内的 25 个前沿大语言模型。除了使用“集体 LLM 作为评判者”方法评估对话质量外,还纳入了成本和延迟指标。结果显示 o4-mini 表现突出,同时强调了性能、成本和延迟之间的权衡。

8、Meta 发布新开源保护工具与 AI 安全进展

Meta 分享了其在 AI 隐私与安全方面的最新进展,发布了包括 CyberSecEval 4 基准套件(新增 CyberSOC Eval 和 AutoPatchBench)在内的新开源保护工具。同时启动了 Llama Defenders Program,旨在帮助合作伙伴利用 AI 强化安全运营。此外,Meta 还初步介绍了 Private Processing 技术,用于在保护用户隐私的前提下,在 WhatsApp 等应用中启用 AI 功能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/78447.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux54 源码包的安装、修改环境变量解决 axel命令找不到;getfacl;测试

始终报错 . 补充链接 tinfo 库时报错软件包 ncurses-devel-5.9-14.20130511.el7_4.x86_64 已安装并且是最新版本 没有可用软件包 tinfo-devel。 无须任何处理 make LDLIBS“-lncurses"报错编译时报错make LDLIBS”-lncurses" ? /opt/rh/devtoolset-11/roo…

FPGA----基于ZYNQ 7020实现EPICS通信系统

1、本实验过程来自博b站大神《神电测控》,原文地址: EPICS实战(上位机篇):基于LV ZYNQ实现的EPICS通信系统(大物理) - 哔哩哔哩https://www.bilibili.com/opus/933476043369480224EPICS实战(下位机篇):基于LV ZYNQ实现的EPICS通信…

实验四 增强型可靠文件传输系统

一、实验目的和任务 掌握基于队列的多文件传输机制理解断点续传的实现原理学习文件传输完整性保障方法 二、实验内容 基础功能验证 单文件传输功能测试服务器状态监控测试传输日志记录验证 新增功能实现 多文件队列传输功能断点续传支持 三、实验步骤 4.1 客户端功能扩…

网络Tips20-003

1.E1载波的控制开销占2/32*100%6.25%,E1载波的基本帧传送时间是125uS。 2.计算机在一个指令周期的过程中,为从内存读取指令操作码,首先要将.程序计数器(PC)的内容送到地址总线上 3.3DES算法:密码学中,3DES是三重数据加密算法通称…

【MySQL】索引(重要)

目录 一、索引本质: 索引的核心作用 索引的优缺点 二、预备知识: 硬件理解: 软件理解: MySQL与磁盘交互基本单位: 三、索引的理解: 理解page: 单个page: 多个page&#x…

【深入浅出MySQL】之数据类型介绍

【深入浅出MySQL】之数据类型介绍 MySQL中常见的数据类型一览为什么需要如此多的数据类型数值类型BIT(M)类型INT类型TINYINT类型BIGINT类型浮点数类型float类型DECIMAL(M,D)类型区别总结 字符串类型CHAR类型VARCHAR(M)类型 日期和时间类型enum和set类型 …

数字化时代下,软件测试中的渗透测试是如何保障安全的?

在如今数字化与信息化的时代,软件测试中存在渗透测试,其位置十分重要,它借助模拟恶意攻击的方式,去发现软件系统所存在的漏洞以及安全问题,这是保障软件安全的关键环节,接下来我会对它的各个方面进行详细介…

Pytorch - Developer Notes 1/2

文章目录 自动混合精度示例典型的混合精度训练处理未缩放梯度梯度裁剪 处理缩放梯度梯度累积梯度惩罚 处理多个模型、损失函数和优化器多 GPU 工作环境下的注意事项单进程中的DataParallel分布式数据并行:每个进程对应一个GPU每个进程使用多块GPU的DistributedDataP…

RuntimeError: CUDA error: __global__ function call is not configured

表明在 CUDA 设备上调用的核函数 没有正确配置线程块和网格维度。 一般体现在: 直接调用 kernel 函数,而不是通过 launch 函数 指定 kernel 函数调用 解决方法(示例): // kernel function __global__ void Idtest_k…

cloudfare+gmail 配置 smtp 邮箱

这里介绍有一个域名后,不需要服务器,就可以实现 cloudfare gmail 的 邮箱收发。 为什么还需要 gmail 的 smtp 功能,因为 cloudfare 默认只是对 email 进行转发,就是只能收邮件而不能发送邮件,故使用 gmail 的功能来进…

如何在 CentOS 7 命令行连接 Wi-Fi?如何在 Linux 命令行连接 Wi-Fi?

如何在 CentOS 7 命令行连接 Wi-Fi?如何在 Linux 命令行连接 Wi-Fi? 摘要 本教程覆盖如何在多种 Linux 发行版下通过命令行连接 Wi-Fi,包括: CentOS 7、Ubuntu、Debian、Arch Linux、Fedora、Alpine Linux、Kali Linux、OpenSU…

基于PHP的在线编程课程学习系统

有需要请加文章底部Q哦 可远程调试 基于PHP在线编程课程学习系统 一 介绍 在线编程课程学习系统基于原生PHP开发,数据库mysql,前端jquery.js。系统角色分为学生,教师和管理员。(附带参考设计文档) 技术栈:phpmysqljquery.jsphps…

PyTorch_张量形状操作

搭建模型时,数据都是基于张量形式的表示,网络层与层之间很多都是以不同的shape的方式进行表现和运算。 对张量形状的操作,以便能够更好处理网络各层之间的数据连接。 reshape 函数的用法 reshape 函数可以再保证张量数据不变的前提下改变数…

大模型实践:图文解锁Ollama在个人笔记本上部署llm

使用在线模型服务时,我们常常需要支付API调用费用,这对于个人开发者或小型组织来说可能是一笔不小的开支。那么,有没有方法可以在本地免费使用这些强大的模型呢?答案是肯定的——Ollama就是这样一个工具。 当然如果是比较大的组织…

Python基本语法(lambda表达式)

lambda表达式 lambda的一般形式是在关键字lambda后面跟一个或多个参数,之后再紧跟一个 冒号,接下来是一个表达式。lambda是一个表达式,而不是一个语句,它能够出现 在Python语法不允许def出现的地方。作为表达式,lambd…

【MySQL数据库】用户管理

目录 1,用户信息 2,创建/删除/修改用户 3,数据库的权限 MySQL数据库安装完之后,我们最开始时使用的都是 root 用户,其它用户通常无法进行操作。因此,MySQL数据库需要对用户进行管理。 1,用户…

Python的ArcPy基于Excel表格对大量遥感影像批量重分类

本文介绍基于Python中的ArcPy模块,以Excel表格内的信息,对遥感影像加以重分类的方法。 首先,明确一下本文的需求。现有按照文章ArcPy批量将栅格文件的属性表导出为Excel表格的方法(https://blog.csdn.net/zhebushibiaoshifu/artic…

LabVIEW 中VI Server导出 VI 配置

该 LabVIEW VI 展示了在 VI Server 中配置和执行 Exported VIs 的过程,实现对服务器端导出 VI 的远程调用与操作。 ​ 具体过程及模块说明 前期配置:需确保在 LabVIEW 的 “Tools> Options > VI Server > Protocols” 路径下,启用 …

论文阅读:2024 ACM SIGSAC Membership inference attacks against in-context learning

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 Membership inference attacks against in-context learning https://arxiv.org/pdf/2409.01380 https://www.doubao.com/chat/4030440311895554 速览 这篇论文主要研究了…

从 Python 基础到 Django 实战 —— 数据类型驱动的 Web 开发之旅

主题简介: 本主题以 Python 基础数据类型为核心,结合 Django 框架的开发流程,系统讲解如何通过掌握数字、字符串、列表、元组、字典等基础类型,快速构建功能完善的 Web 应用。通过理论与实践结合,帮助学员从零基础 Py…