LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

目录

相关文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

OpenAI o3-mini的简介

1、特点

2、性能表现

>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率

>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率

3、模型速度和性能

4、安全性

5、未来展望

OpenAI o3-mini的安装和使用方法

1、安装

2、使用方法

ChatGPT

API

OpenAI o3-mini的案例应用


相关文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读-CSDN博客

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略-CSDN博客

OpenAI o3-mini的简介

OpenAI o3-mini是OpenAI发布的最新推理模型,也是该系列中最经济高效的模型。它于2024年12月预览,现已在ChatGPT和API中可用。o3-mini是一个强大且快速的模型,它突破了小型模型的性能限制,在科学、数学和编码等STEM领域展现出卓越的能力,同时保持了与OpenAI o1-mini相同的低成本和低延迟。

o3-mini是第一个支持函数调用结构化输出开发者消息小型推理模型,使其具备生产就绪能力。它支持流式输出,并提供低、中、高三种推理强度选项,以适应不同的使用场景。 o3-mini作为一款经济高效、功能强大的推理模型,已在多种平台和API中推出,并对不同用户群体开放,极大提升了AI技术的易用性和可及性。目前已在ChatGPT Plus、Team和Pro版本中上线,企业版将于2月上线。API方面,o3-mini已开始向API使用等级3-5的开发者推出。免费用户也可以在ChatGPT中使用o3-mini。

总而言之,OpenAI o3-mini 是一款在保持低成本低延迟的同时,拥有强大STEM能力,尤其在科学、数学和编码方面表现出色的推理模型。它支持多种开发者功能,并提供了多种推理强度选项,以适应不同的使用场景。在多个基准测试中,o3-mini 的性能超越了其前代模型,并且在安全性方面也进行了充分的考量。o3-mini 的发布标志着 OpenAI 在经济高效人工智能领域取得了重要进展,也为更广泛的 AI 应用铺平了道路。

官网文章:https://openai.com/index/openai-o3-mini/

1、特点

>> 高性价比:o3-mini在保持低成本和低延迟的同时,提供了强大的推理能力。
>> 强大的STEM能力:在科学、数学和编码方面表现出色,尤其在解决复杂问题方面能力突出。
>> 丰富的开发者功能:支持函数调用、结构化输出和开发者消息,方便开发者集成到各种应用中。
>> 可调节的推理强度:提供低、中、高三种推理强度选项,允许开发者根据具体应用场景调整模型的推理深度和速度。
>> 快速响应:平均响应时间比o1-mini快24%,首次token生成时间快2500毫秒。
>> 更高的准确性:专家测试显示,o3-mini的答案更准确、更清晰,推理能力更强,错误率降低了39%。
>> 支持搜索:可以结合搜索引擎查找最新的信息,并提供相关链接(目前为早期原型)。
>> 安全性:采用审慎对齐技术进行训练,在安全性和防越狱评估中表现优异。

2、性能表现

o3-mini在STEM领域表现出色,尤其在数学、编码和科学方面,其性能与OpenAI o1相当甚至超越,同时响应速度更快,错误率更低。o3-mini在各种STEM相关的基准测试和人类偏好测试中均表现优异,证明了其在准确性、速度和推理能力方面的优势。

在多个基准测试中,o3-mini均取得了优异的成绩,包括:

>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率

>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率

>> FrontierMath:o3-mini (高推理强度)在首次尝试时解决了超过32%的问题。

>> 竞赛编码 (Codeforces):o3-mini在不同推理强度下均优于o1-mini。

>> 软件工程 (SWE-bench Verified):o3-mini是目前在SWEbench-verified上表现最佳的模型。

>> LiveBench 编码:o3-mini在中、高推理强度下均优于o1-high。

>> 一般知识:o3-mini在一般知识评估中优于o1-mini。

在人类偏好评估中,测试者更倾向于o3-mini的回答 (56%),并且错误率降低了39%。o3-mini的响应速度比o1-mini快24%。

3、模型速度和性能

o3-mini在保持与OpenAI o1相当的智能水平的同时,实现了更快的性能和更高的效率。o3-mini在速度和效率方面显著优于其前代模型,这使其更适合需要快速响应的应用场景。

o3-mini的平均响应时间为7.7秒,比o1-mini的10.16秒快24%。它在首次生成token的时间上也比o1-mini快2500毫秒。

4、安全性

OpenAI 采取了严格的安全措施来确保 o3-mini 的安全性和可靠性。OpenAI 使用审慎对齐技术训练 o3-mini,使其能够安全地响应用户提示。o3-mini在安全性和防越狱评估中显著优于GPT-4o。

在部署之前,OpenAI 对 o3-mini 进行了全面的安全评估,包括外部红队测试和安全评估。详细的评估结果可在 o3-mini 系统卡片中查看。

5、未来展望

OpenAI 将继续努力降低 AI 成本,并提升 AI 的性能和安全性。OpenAI 将继续致力于开发平衡智能、效率和安全性的模型。OpenAI o3-mini 的发布是 OpenAI 持续推进经济高效人工智能发展的重要一步,它使得高质量的 AI 更加易于获取。

OpenAI o3-mini的安装和使用方法

1、安装

OpenAI o3-mini 目前并未开源,不支持本地部署。用户只能通过在线方式(例如在ChatGPT中使用)或调用OpenAI提供的API来使用该模型。

2、使用方法

ChatGPT

ChatGPT Plus、Team和Pro用户可以直接在模型选择器中选择o3-mini使用。免费用户可以通过选择“Reason”或重新生成回复来使用o3-mini。

付费用户 (Plus, Team, Pro):直接在ChatGPT的模型选择器中选择 o3-mini 即可使用。

免费用户:可以通过两种方式使用:在消息输入框中选择 "Reason"。重新生成已有的回复。

API

o3-mini已开始在Chat Completions API、Assistants API和Batch API中向特定等级的开发者推出。 具体使用方法取决于你选择的 API,请参考 OpenAI 的 API 文档。开发者可以根据需求选择三种推理强度:低、中、高。 高强度推理会更准确,但响应速度较慢;低强度推理速度更快,但准确性可能略低。 中等强度则在速度和准确性之间取得平衡。
API地址:https://platform.openai.com/docs/models#current-model-aliases

from openai import OpenAI
client = OpenAI()completion = client.chat.completions.create(model="o3-mini",messages=[{"role": "developer", "content": "You are a helpful assistant."},{"role": "user","content": "Write a haiku about recursion in programming."}]
)print(completion.choices[0].message)

OpenAI o3-mini的案例应用

持续更新中……

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/894406.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

女生年薪12万,算不算属于高收入人群

在繁华喧嚣的都市中,我们时常会听到关于收入、高薪与生活质量等话题的讨论。尤其是对于年轻女性而言,薪资水平不仅关乎个人价值的体现,更直接影响到生活质量与未来的规划。那么,女生年薪12万,是否可以被划入高收入人群…

AI开发学习之——PyTorch框架

PyTorch 简介 PyTorch (Python torch)是由 Facebook AI 研究团队开发的开源机器学习库,广泛应用于深度学习研究和生产。它以动态计算图和易用性著称,支持 GPU 加速计算,并提供丰富的工具和模块。 PyTorch的主要特点 …

Python安居客二手小区数据爬取(2025年)

目录 2025年安居客二手小区数据爬取观察目标网页观察详情页数据准备工作:安装装备就像打游戏代码详解:每行代码都是你的小兵完整代码大放送爬取结果 2025年安居客二手小区数据爬取 这段时间需要爬取安居客二手小区数据,看了一下相关教程基本…

OpenCV:开运算

目录 1. 简述 2. 用腐蚀和膨胀实现开运算 2.1 代码示例 2.2 运行结果 3. 开运算接口 3.1 参数详解 3.2 代码示例 3.3 运行结果 4. 开运算应用场景 5. 注意事项 6. 总结 相关阅读 OpenCV:图像的腐蚀与膨胀-CSDN博客 OpenCV:闭运算-CSDN博客 …

JavaWeb入门-请求响应(Day3)

(一)请求响应概述 请求(HttpServletRequest):获取请求数据 响应(HttpServletResponse):设置响应数据 BS架构:Browser/Server,浏览器/服务器架构模式。客户端只需要浏览器就可访问,应用程序的逻辑和数据都存储在服务端(维护方便,响应速度一般) CS架构:Client/ser…

【SLAM】于AutoDL云上GPU运行GCNv2_SLAM的记录

配置GCNv2_SLAM所需环境并实现AutoDL云端运行项目的全过程记录。 本文首发于❄慕雪的寒舍 1. 引子 前几天写了一篇在本地虚拟机里面CPU运行GCNv2_SLAM项目的博客:链接,关于GCNv2_SLAM项目相关的介绍请移步此文章,本文不再重复说明。 GCNv2:…

罗格斯大学:通过输入嵌入对齐选择agent

📖标题:AgentRec: Agent Recommendation Using Sentence Embeddings Aligned to Human Feedback 🌐来源:arXiv, 2501.13333 🌟摘要 🔸多代理系统必须决定哪个代理最适合给定的任务。我们提出了一种新的架…

【实战篇】Android安卓本地离线实现视频检测人脸

实战篇Android安卓本地离线实现视频检测人脸 引言项目概述核心代码类介绍人脸检测流程项目地址总结 引言 在当今数字化时代,人脸识别技术已经广泛应用于各个领域,如安防监控、门禁系统、移动支付等。本文将以第三视角详细讲解如何基于bifan-wei-Face/De…

团体程序设计天梯赛-练习集——L1-025 正整数A+B

一年之际在于春,新年的第一天,大家敲代码了吗?哈哈 前言 这道题分值是15分,值这个分,有一小点运算,难度不大,虽然说做出来了,但是有两个小疑点。 L1-025 正整数AB 题的目标很简单…

Leetcode:598

1,题目 2,思路 脑筋急转弯,看题目一时半会还没搞懂意思。 其实不然就是说ops是个矩阵集合,集合的每个矩阵有俩个元素理解为行列边距 m和n是理解为一个主矩阵,计算ops的每个小矩阵还有这个主矩阵的交集返回面积 3&…

web前端12--表单和表格

1、表格标签 使用<table>标签来定义表格 HTML 中的表格和Excel中的表格是类似的&#xff0c;都包括行、列、单元格、表头等元素。 区别&#xff1a;HTML表格在功能方面远没有Excel表格强大&#xff0c;HTML表格不支持排序、求和、方差等数学计算&#xff0c;主要用于布…

为何 git 默认是 master分支,而github默认是main分支(DeepSeek问答)

为何 git 默认是 master分支&#xff0c;而github默认是main分支 Git 和 GitHub 在默认分支名称上的差异源于历史背景和社会因素的变化。 Git 的 master 分支 历史原因&#xff1a;Git 由 Linus Torvalds 于 2005 年创建&#xff0c;最初使用 master 作为默认分支名称&#x…

【AI】探索自然语言处理(NLP):从基础到前沿技术及代码实践

Hi &#xff01; 云边有个稻草人-CSDN博客 必须有为成功付出代价的决心&#xff0c;然后想办法付出这个代价。 目录 引言 1. 什么是自然语言处理&#xff08;NLP&#xff09;&#xff1f; 2. NLP的基础技术 2.1 词袋模型&#xff08;Bag-of-Words&#xff0c;BoW&#xff…

Java集合+并发(部分)

Java集合 Java集合类的继承结构和各自的适用情况 Collection ​ — List ​ — ArrayList&#xff1a;动态数组 ​ — LinkedList&#xff1a;底层是双向链表&#xff0c;应用于Queue接口可以用于实现队列&#xff0c;应用于Deque接口可以用于实现栈 ​ — Vector&#x…

第1章 量子暗网中的血色黎明

月球暗面的危机与阴谋 量子隧穿效应催生的幽蓝电弧&#xff0c;于环形山表面肆意跳跃&#xff0c;仿若无数奋力挣扎的机械蠕虫&#xff0c;将月球暗面的死寂打破&#xff0c;徒增几分诡异。艾丽伫立在被遗弃的“广寒宫”量子基站顶端&#xff0c;机械义眼之中&#xff0c;倒映着…

AI-ISP论文Learning to See in the Dark解读

论文地址&#xff1a;Learning to See in the Dark 图1. 利用卷积网络进行极微光成像。黑暗的室内环境。相机处的照度小于0.1勒克斯。索尼α7S II传感器曝光时间为1/30秒。(a) 相机在ISO 8000下拍摄的图像。(b) 相机在ISO 409600下拍摄的图像。该图像存在噪点和色彩偏差。©…

Python3 【高阶函数】项目实战:5 个学习案例

Python3 【高阶函数】项目实战&#xff1a;5 个学习案例 本文包含 5 个关于“高阶函数”的综合应用项目&#xff0c;每个项目都包含完整的程序代码、测试案例和执行结果。具体项目是&#xff1a; 成绩统计分析单词统计工具简易计算器工厂任务调度器数据管道处理 项目 1&#…

【Git】初识Git Git基本操作详解

文章目录 学习目标Ⅰ. 初始 Git&#x1f4a5;注意事项 Ⅱ. Git 安装Linux-centos安装Git Ⅲ. Git基本操作一、创建git本地仓库 -- git init二、配置 Git -- git config三、认识工作区、暂存区、版本库① 工作区② 暂存区③ 版本库④ 三者的关系 四、添加、提交更改、查看提交日…

RK3568使用QT操作LED灯

文章目录 一、QT中操作硬件设备思路Linux 中的设备文件操作硬件设备的思路1. 打开设备文件2. 写入数据到设备3. 从设备读取数据4. 设备控制5. 异常处理在 Qt 中操作设备的典型步骤实际应用中的例子:控制 LED总结二、QT实战操作LED灯设备1. `mainwindow.h` 头文件2. `mainwindo…

分布式微服务系统架构第90集:现代化金融核心系统

#1.1 深化数字化转型&#xff0c;核心面临新挑战 1、架构侧&#xff1a;无法敏捷协同数字金融经营模式转型。 2、需求侧&#xff1a;业务需求传导低效始终困扰金融机构。 3、开发侧&#xff1a;创新产品上市速度低于期望。 4、运维侧&#xff1a;传统面向资源型监控体系难以支撑…