Claude Haiku 4.5新功能、模型与定价,免费试用国内直连教程

news/2025/10/18 13:00:09/文章来源:https://www.cnblogs.com/whatai/p/19147218

Claude 4.5 的新功能

了解 Claude 4.5 中引入的新功能和改进,包括 Sonnet 4.5 和 Haiku 4.5 模型。

Claude 4.5 引入了两个针对不同用例设计的模型:

  • Claude Sonnet 4.5:我们用于复杂代理和编程的最佳模型,在大多数任务中具有最高的智能水平
  • Claude Haiku 4.5:我们最快且最智能的 Haiku 模型,具有接近前沿的性能。第一个支持扩展思维的 Haiku 模型

Claude Haiku 4.5新功能、模型与定价,免费试用国内直连教程

Sonnet 4.5 相比 Sonnet 4 的关键改进

编程卓越性

Claude Sonnet 4.5 是我们迄今为止最好的编程模型,在整个开发生命周期中都有显著改进:

  • SWE-bench Verified 性能:在编程基准测试中达到先进的最新水平
  • 增强的规划和系统设计:更好的架构决策和代码组织
  • 改进的安全工程:更强大的安全实践和漏洞检测
  • 更好的指令遵循:更精确地遵循编程规范和要求

 

代理能力

Claude Sonnet 4.5 在代理能力方面引入了重大进步:

  • 扩展的自主操作:Sonnet 4.5 可以独立工作数小时,同时保持清晰度并专注于增量进展。该模型一次在少数任务上取得稳定进展,而不是试图同时处理所有事情。它提供基于事实的进度更新,准确反映已完成的工作。
  • 上下文感知:Claude 现在在整个对话过程中跟踪其令牌使用情况,在每次工具调用后接收更新。这种感知有助于防止过早放弃任务,并在长时间运行的任务上实现更有效的执行。有关技术详细信息,请参阅上下文感知和提示指导。
  • 增强的工具使用:该模型更有效地使用并行工具调用,在研究期间同时启动多个推测性搜索,并同时阅读多个文件以更快地构建上下文。跨多个工具和信息源的改进协调使模型能够在代理搜索和编程工作流中有效利用广泛的能力。
  • 高级上下文管理:Sonnet 4.5 在外部文件中保持出色的状态跟踪,在会话间保持目标导向。结合更有效的上下文窗口使用和我们新的上下文管理 API 功能,该模型最优地处理扩展会话中的信息,以保持长期的连贯性。

上下文感知在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。

沟通和交互风格

Claude Sonnet 4.5 具有精炼的沟通方式,简洁、直接且自然。它提供基于事实的进度更新,可能会跳过工具调用后的冗长摘要以保持工作流动力(尽管这可以通过提示进行调整)。

创意内容生成

Claude Sonnet 4.5 在创意内容任务中表现出色:

  • 演示文稿和动画:在创建幻灯片和视觉内容方面匹配或超越 Claude Opus 4.1
  • 创意天赋:产生精美、专业的输出,具有强大的指令遵循能力
  • 首次尝试质量:在初次尝试中生成可用的、设计良好的内容

Haiku 4.5 相比 Haiku 3.5 的关键改进

Claude Haiku 4.5 代表了 Haiku 模型系列的变革性飞跃,为我们最快的模型类别带来了前沿能力:

接近前沿的智能与极快速度

Claude Haiku 4.5 以显著更低的成本和更快的速度提供匹配 Sonnet 4 的接近前沿性能:

  • 接近前沿的智能:在推理、编程和复杂任务中匹配 Sonnet 4 的性能
  • 增强的速度:比 Sonnet 4 快两倍以上,优化了每秒输出令牌数(OTPS)
  • 最优的成本性能:以三分之一的成本提供接近前沿的智能,非常适合大容量部署

扩展思维能力

Claude Haiku 4.5 是第一个支持扩展思维的 Haiku 模型,为 Haiku 系列带来了高级推理能力:

  • 高速推理:访问 Claude 的内部推理过程进行复杂问题解决
  • 思维摘要:为生产就绪部署提供摘要思维输出
  • 交错思维:在工具调用之间进行思考,实现更复杂的多步骤工作流
  • 预算控制:配置思维令牌预算以平衡推理深度与速度

扩展思维必须通过在 API 请求中添加thinking 参数来显式启用。有关实现详细信息,请参阅扩展思维文档。

 

在 Claude Sonnet 3.7、Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。

上下文感知

Claude Haiku 4.5 具有上下文感知功能,使模型能够在整个对话过程中跟踪其剩余的上下文窗口:

  • 令牌预算跟踪:Claude 在每次工具调用后接收关于剩余上下文容量的实时更新
  • 更好的任务持久性:模型可以通过了解可用的工作空间更有效地执行任务
  • 多上下文窗口工作流:改进了跨扩展会话的状态转换处理

这是第一个具有原生上下文感知能力的 Haiku 模型。

在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。

强大的编程和工具使用

Claude Haiku 4.5 提供现代 Claude 模型期望的强大编程能力:

  • 编程熟练度:在代码生成、调试和重构任务中表现强劲
  • 完整工具支持:与所有 Claude 4 工具兼容,包括 bash、代码执行、文本编辑器、网络搜索和计算机使用
  • 增强的计算机使用:针对自主桌面交互和浏览器自动化工作流进行了优化
  • 并行工具执行:跨多个工具的高效协调,用于复杂工作流

Haiku 4.5 专为需要智能和效率的用例而设计:

  • 实时应用:为交互式用户体验提供快速响应时间
  • 大容量处理:为大规模部署提供成本效益的智能
  • 免费层实现:以可访问的价格提供高级模型质量
  • 子代理架构:为多代理系统提供快速、智能的代理
  • 大规模计算机使用:成本效益的自主桌面和浏览器自动化

新的 API 功能

内存工具(Beta)

新的内存工具使 Claude 能够在上下文窗口之外存储和检索信息:

tools=[{"type": "memory_20250818","name": "memory"}
]

这允许:

  • 随时间构建知识库
  • 跨会话维护项目状态
  • 通过基于文件的存储保持有效无限的上下文

在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。需要beta 头:
context-management-2025-06-27

上下文编辑

使用上下文编辑通过自动工具调用清理进行智能上下文管理:

response = client.beta.messages.create(betas=["context-management-2025-06-27"],model="claude-sonnet-4-5",  # or claude-haiku-4-5max_tokens=4096,messages=[{"role": "user", "content": "..."}],context_management={"edits": [{"type": "clear_tool_uses_20250919","trigger": {"type": "input_tokens", "value": 500},"keep": {"type": "tool_uses", "value": 2},"clear_at_least": {"type": "input_tokens", "value": 100}}]},tools=[...]
)

此功能在接近令牌限制时自动删除较旧的工具调用和结果,有助于管理长时间运行的代理会话中的上下文。

在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。需要beta 头:
context-management-2025-06-27

增强的停止原因

Claude 4.5 模型引入了新的
model_context_window_exceeded 停止原因,明确指示生成因达到上下文窗口限制而停止,而不是请求的
max_tokens 限制。这使得在应用程序逻辑中处理上下文窗口限制变得更容易。

{"stop_reason": "model_context_window_exceeded","usage": {"input_tokens": 150000,"output_tokens": 49950}
}

改进的工具参数处理

Claude 4.5 模型包含一个错误修复,保留工具调用字符串参数中的有意格式。以前,字符串参数中的尾随换行符有时会被错误地剥离。此修复确保需要精确格式的工具(如文本编辑器)完全按照预期接收参数。

这是一个幕后改进,不需要 API 更改。但是,具有字符串参数的工具现在可能会接收到以前被剥离的尾随换行符的值。

示例:

// 之前:最终换行符意外被剥离
{"type": "tool_use","id": "toolu_01A09q90qw90lq917835lq9","name": "edit_todo","input": {"file": "todo.txt","contents": "1. Chop onions.\n2. ???\n3. Profit"}
}// 之后:尾随换行符按预期保留
{"type": "tool_use","id": "toolu_01A09q90qw90lq917835lq9","name": "edit_todo","input": {"file": "todo.txt","contents": "1. Chop onions.\n2. ???\n3. Profit\n"}
}

令牌计数优化

Claude 4.5 模型包含自动优化以改善模型性能。这些优化可能会向请求添加少量令牌,但
您不会为这些系统添加的令牌付费

Claude 4 中引入的功能

以下功能在 Claude 4 中引入,并在所有 Claude 4 模型中可用,包括 Claude Sonnet 4.5 和 Claude Haiku 4.5。

新的拒绝停止原因

Claude 4 模型为模型因安全原因拒绝生成的内容引入了新的
refusal 停止原因:

{"id":"msg_014XEDjypDjFzgKVWdFUXxZP",
"type":"message",
"role":"assistant",
"model":"claude-sonnet-4-5",
"content":[{"type":"text","text":"I would be happy to assist you. You can "}],
"stop_reason":"refusal",
"stop_sequence":null,
"usage":{"input_tokens":564,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":22}
}

使用 Claude 4 模型时,您应该更新应用程序以处理refusal 停止原因。

摘要思维

启用扩展思维后,Claude 4 模型的 Messages API 返回 Claude 完整思维过程的摘要。摘要思维提供扩展思维的全部智能优势,同时防止滥用。

虽然 API 在 Claude 3.7 和 4 模型中是一致的,但扩展思维的流式响应可能以"块状"传递模式返回,流式事件之间可能有延迟。

摘要由与您在请求中目标的模型不同的模型处理。思维模型看不到摘要输出。

 

交错思维

Claude 4 模型支持将工具使用与扩展思维交错,允许更自然的对话,其中工具使用和响应可以与常规消息混合。

交错思维处于 beta 阶段。要启用交错思维,请将[beta 头](/zh-CN/api/beta-headers) `interleaved-thinking-2025-05-14` 添加到您的 API 请求中。

 

行为差异

Claude 4 模型具有显著的行为变化,可能会影响您构建提示的方式:

沟通风格变化

  • 更简洁直接:Claude 4 模型沟通更高效,解释不那么冗长
  • 更自然的语调:响应稍微更对话化,不那么机械化
  • 注重效率:可能会跳过完成操作后的详细摘要以保持工作流动力(如果需要,您可以提示获得更多详细信息)

指令遵循

Claude 4 模型经过精确指令遵循训练,需要更明确的指导:

  • 明确说明操作:如果您希望 Claude 采取行动,请使用直接语言,如"进行这些更改"或"实现此功能",而不是"您能建议更改吗"
  • 清楚地说明期望的行为:Claude 会精确遵循指令,因此明确说明您想要的内容有助于获得更好的结果

更新的文本编辑器工具

文本编辑器工具已为 Claude 4 模型更新,具有以下更改:

  • 工具类型
    text_editor_20250728
  • 工具名称
    str_replace_based_edit_tool
  • 不再支持
    undo_edit 命令

`str_replace_editor` 文本编辑器工具对于 Claude Sonnet 3.7 保持不变。

如果您正在从 Claude Sonnet 3.7 迁移并使用文本编辑器工具:

# Claude Sonnet 3.7
tools=[{"type": "text_editor_20250124","name": "str_replace_editor"}
]# Claude 4 模型
tools=[{"type": "text_editor_20250728","name": "str_replace_based_edit_tool"}
]

更新的代码执行工具

如果您正在使用代码执行工具,请确保您使用的是最新版本
code_execution_20250825,它添加了 Bash 命令和文件操作功能。

旧版本
code_execution_20250522(仅 Python)仍然可用,但不建议用于新实现。

 

定价和可用性

定价

Claude 4.5 模型保持竞争性定价:

模型 输入 输出
Claude Sonnet 4.5 每百万令牌 $3 每百万令牌 $15
Claude Haiku 4.5 每百万令牌 $1 每百万令牌 $5

 

第三方平台定价

从 Claude 4.5 模型(Sonnet 4.5 和 Haiku 4.5)开始,AWS Bedrock 和 Google Vertex AI 提供两种端点类型:

  • 全球端点:动态路由以获得最大可用性
  • 区域端点:保证通过特定地理区域进行数据路由,
    价格上涨 10%

此区域定价适用于 Claude Sonnet 4.5 和 Claude Haiku 4.5。

Claude API (1P) 默认是全球的,不受此更改影响。 Claude API 仅为全球(相当于其他提供商的全球端点产品和定价)。

国内用户可以使用神马中转API(api.whatai.cc),Claude Haiku 4.5 * 全渠道已全面上线,欢迎免费体验!

Claude Haiku 4.5新功能、模型与定价,免费试用国内直连教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/938727.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络编程实践笔记_4_阿贝云_免费云服务器_简易博客_

简易博客 AI搜索 python后台有了简单方便的服务器,(在我的理解下还是个电脑主机,只不过连着网,实际就像个内网的AGV小车,可以ssh到他而已), ssh远程控制和scp远程传输文件之后,就可以准备代码了, 没做过网页编…

10 17

4.4终于把这道题调出来了啊/ll,不容易啊/ll 首先我写错的最大的点是 \(sum_x\) 把它也异或了 \(siz_x\) 次 其次是 op = 1 的 soltwo 的时候没有判 \(x = y\) 的情况 然后是 \(soltwo(x,y)\) \(x\) 往上的时候没有让…

深入解析:日语学习-日语知识点小记-进阶-JLPT-N1阶段应用练习(2):语法 +考え方15+2022年7月N1

深入解析:日语学习-日语知识点小记-进阶-JLPT-N1阶段应用练习(2):语法 +考え方15+2022年7月N12025-10-17 10:35 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: norma…

2025年铝单板厂家推荐排行榜,氟碳铝单板,木纹铝单板,冲孔铝单板,外墙铝单板,雕花铝单板,异形铝单板,双曲铝单板公司推荐!

2025年铝单板厂家推荐排行榜,氟碳铝单板,木纹铝单板,冲孔铝单板,外墙铝单板,雕花铝单板,异形铝单板,双曲铝单板公司推荐!行业背景与发展趋势铝单板作为现代建筑装饰材料的重要组成部分,近年来在建筑外立面、室…

2025 年最新推荐热熔胶源头厂家榜:覆盖书刊装订 / 包装等场景,助企业选高性价比产品

当前热熔胶应用广泛,却面临产品质量参差不齐、技术适配性不足、服务响应滞后等问题,下游企业在选购时常陷入困境,难以找到契合自身需求的高性价比源头厂家。为解决这一难题,帮助印刷、包装、鞋材等行业企业精准筛选…

开发日志

一个常用的工具:Mapster 进行一些对象属性复制的时候很方便。跟基础库里的DeepCopy配置起来使用。 配置文件的保存:目前基本上还是使用XML为主。 尝试了HASH,JSON,YAML,最终还是感觉XML使用总体体量更好。 XML,可…

Gitee 2025:中国开发者生态的崛起与本土化优势

Gitee 2025:中国开发者生态的崛起与本土化优势 在全球化与本土化交织的软件开发时代,中国开发者正面临一个关键选择:是继续依赖国际化的GitHub,还是拥抱更符合本土需求的Gitee?2025年的今天,这个答案已经变得清晰…

C++中的new操作符:new operator、operator new、placement new

new操作符(new operator) 当你写这种代码时: string *ps = new string("Memory Management"); 你使用的new是new操作符。 new操作符的动作包含两部分:在堆上为创建的对象申请内存 调用对象的构造函数进行…

JavaBean知识总结及范例

一、什么是 JavaBean? JavaBean 本质上是一个符合特定编码约定的 Java 类。它不是一个框架或技术,而是一种标准/规范。遵循这个规范的类,可以被特定的工具(如 IDE、Spring 框架等)更便捷地发现、使用和操作。二、…

C++20 协程的简单示例

C++20 协程的简单示例以下使用编译器版本为:gcc version 11.4.0 c++20 懒得介绍协程是什么,先直接贴一个最简单的例子:1 #include <iostream>2 #include <coroutine>3 #include <stdexcept>4 #in…

HMAC-SHA256 请求签名与验签实践(Python 可直接复用)

HMAC-SHA256 请求签名与验签实践(Python 可直接复用)目标:沉淀一套“能复制即用”的签名/验签规范与代码,解决接口防篡改与防伪造。 关键规则:待签名串:METHOD + "\n" + Content-MD5 + "\n"…

2025 年家装管道生产厂家最新推荐排行榜:覆盖云南昆明贵州贵阳四川成都重庆,精选优质 PPR/PVC 管道品牌,解决选购难题

在家装过程中,管道作为水电系统的核心部件,其质量直接决定居住安全与生活舒适度。当前家装管道市场混乱,部分厂商偷工减料,导致管道抗压差、易老化、密封性不足,漏水渗水问题频发,给业主带来巨大财产损失与生活困…

同一设备多账号登录,如何避免消息推送“串门”?

对各应用厂商而言,推送通知消息是App提高用户活跃度和转化率的高性价比营销工具。然而,当一个用户设备登录多个账号时,开发者可能会遇到同一条消息在同一设备的不同账号上重复展示的问题,这不仅降低了消息推送的精…

强合规行业DevOps选型:告别工具拼凑,找到真正适配的国产化DevOps方案

强合规行业DevOps平台选型需“建体系”,传统开源工具组合易陷数据割裂、合规难达标困境。本文对比三款DevOps产品,其中国产DevOps平台契合信创DevOps需求,内置合规卡点与追溯能力,适配国产化环境,助力企业平衡合规…

实用指南:精读 C++20 设计模式:行为型设计模式——观察者模式

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

大疆无人机RTMP推流至LiveNVR实现web页面实时播放与录像回放,并可以转GB28181协议级联推送给上级监控视频管理平台

@目录1、无人机推流转国标2、获取RTMP推流地址2.1、RTMP推流地址格式2.2、推流地址示例2、设备RTMP推流3、配置拉转RTMP3.1、直播流地址格式3.2、直播流地地址示例3.3、通道配置直播流地址4、配置级联到GB28181国标平台…

Character Animator 2025下载安装教程:2D角色动画软件零基础入门,附最新下载安装教程及激活方法

还在找Character Animator 2025怎么下载安装?这份保姆级教程帮你一步到位!不管是做虚拟主播、短视频动画,还是教育课件制作,掌握CH 2025的安装方法是第一步。本文包含详细下载渠道、安装步骤、快捷键及常见问题,看…

2025年彩钢瓦/镀锌板/折弯件/C型钢/Z型钢/压型瓦/楼承板/次檩条厂家推荐排行榜,专业钢结构安装与定制加工实力解析

2025年彩钢瓦/镀锌板/折弯件/C型钢/Z型钢/压型瓦/楼承板/次檩条厂家推荐排行榜,专业钢结构安装与定制加工实力解析随着我国建筑工业化的快速发展,钢结构建筑因其施工周期短、抗震性能好、可回收利用等优势,在工业厂…

2025 年最新金相厂家最新推荐排行榜:涵盖金相磨抛机 / 切割机 / 显微镜 / 抛光机 / 预磨机设备,助力企业精准选择优质品牌

当前材料检测行业持续发展,金相检测作为材料分析核心环节,对石油机械、铁路器材、航空航天等领域的产品质量与安全起着关键作用。随着市场需求升级,金相品牌数量激增,但品牌间技术实力、产品质量和服务水平差距明显…

武汉图核科技

武汉图核科技新的名字 以前的名字是英语单词音译过来的,没有什么具体含义,也不容易看出是做什么的。中国人还是取个中文名好一些,于是想换个名字,要言简意赅,简单好记。不擅长取名,找AI来帮忙:一眼相中了图核科…