两天烧掉200美元!我AI大模型网关终于支持了Claude模型

这是一个关于“真金白银”的开发故事。

Chats 1.9.0 发布于 2025 年 11 月 27 日,距离上一个版本发布仅过去了不到一个月。但对 Chats 来说,这却是一个里程碑式的版本:我们不仅全面支持了 Anthropic(Claude)模型,还顺带把 .NET 10 给升了,甚至还搞出了一套能在 Chats 里“借壳”跑 Claude Code 的 API 兼容层。

而在这一切的背后,是一张让我“肉痛”的 Azure 账单。


一切源于“微软与 Anthropic 联手”

事情要从 2025 年 11 月 19 日说起。那天,微软与 Anthropic 达成合作,宣布将在 Azure 平台上提供 Anthropic 的 Claude 大模型服务。这意味着开发者和企业用户可以通过 Azure 云服务访问 Claude 模型。

作为一名微软 MVP,我本以为 Claude 模型对 MVP 额度来说是可以使用的,因为根据以往的经验,如果没有资格使用某项服务,通常会直接在控制台里提示“无权限”或“无法启用”,而不是直接允许使用然后产生高额费用,但我大意了。

因此我第一时间就想到了将 Claude 模型集成到我自己的项目中——Sdcb Chats

当时为了确保 Anthropic Messages API 工作正常且稳定,我做了大量的测试。为了验证兼容性,我甚至还“站起来蹬”,直接接入了 Anthropic 官方的命令行工具 Claude Code 来跑 Opus 模型。

结果……短短 2 天时间,我在 Azure 上跑 Claude 模型的 API 调用费用就高达 192.95 美元

当时看到账单整个人都是蒙的。不过好在“氪金”没有白费,最终我成功将 Claude 模型完美集成到了 Sdcb Chats 中。现在,大家可以在 Chats 中愉快地使用 Claude 模型了!


1.9.0 的核心:Anthropic 全面落地

在 1.9.0 之前,Chats 对 Claude 的支持只能说是“能用”,因为并没有原生支持 Anthropic Messages API,需要通过 OpenAI 兼容接口转译——而 OpenAI Chat Completions 兼容接口并不支持 Extended Thinking。但这一次,我是原生支持

原生 HttpClient 实现与 Thinking 支持

为了追求极致的性能和可控性,我重写了 Chats 的底层调用逻辑。

原本 Anthropic 提供了Anthropic C# API Library,我一开始使用了这个 SDK,但发现里面的验证逻辑有点太过分了,连模型名称都要验证(报错说:AnthropicInvalidDataException: Data did not match any variant of RawMessageStreamEvent)。在我开发的时候,Opus 模型还没发布 4.5 版本,我使用这个 SDK 连自家的 Claude 4.5 Opus 都报错,笑死!更不要提用这个 SDK 连接国产的 MiniMax/GLM/DeepSeek v3.2 了,这种操作非常“Anthropic”(这个问题直到 2026-01-14 发布的 12.2.0 版本中才解决!)。

image

因此我的 Git 提交记录里可以看到,我一开始是准备走 SDK 做 Anthropic 支持的,但最终又放弃了,转而在代码中用原生 HttpClient 手撸了一个近 1000 行的 AnthropicChatService

这意味着什么?

  1. 完整支持 Thinking(思维链):Claude 模型的 Thinking 可以像在官方网页版那样展示,支持流式输出,“思考”与“回答”分离。为此我在数据库中专门新增了 StepContentThink 表,用于独立存储思维内容。

  2. Signature(签名)验证:Chats 现在能正确处理和存储 Claude 的思维签名(Signature),确保证据链完整。

  3. Vision Link 优化:默认使用 URL 而非 Base64 传图,大幅节省带宽和 Token。

同时,我还引入了 MaxThinkingBudget(模型级)和 ThinkingBudget(会话级)配置,防止你的 Token 再像我一样“不知不觉”地烧完。


“借壳上位”:Anthropic Messages API 兼容

这一条可能比原生支持更硬核。

Chats 1.9.0 反向实现了 Anthropic 的官方 API 协议(/v1/messages)。我在 src/BE/web/Controllers/Api/AnthropicCompatible/AnthropicMessagesController.cs 中完整复刻了 Anthropic 的接口规范。这意味着 Chats 不仅是一个客户端,它本身也变成了一个标准的 Anthropic API 服务端

为什么要这么做?

因为现在有很多优秀的工具(比如 Cursor、Claude Code、各种 AI 插件)只支持 Anthropic 原生协议。为了支持官方的 claude-code 命令行工具(如动图,后台可以实时追踪 Claude Code 的使用信息):

我甚至专门修复了 System Prompt 的解析逻辑,同时,我还引入了 MaxThinkingBudget(模型级)和 ThinkingBudget(会话级)配置,以及 Prompt Cache Token 的计费支持(Commit 85a1c2a6),防止你的 Token 再像我一样“不知不觉”地烧完。

既然 Chats 已经变成了一个强大的 API 网关,那么配套的开发者体验必须跟上。

1.9.0 新增了 Build 模块,包含三个核心页面:

  • API Keys:更安全的密钥管理,支持过期时间、备注,还能看到密钥掩码。
  • Docs:一站式文档,列出了所有兼容 OpenAI 和 Anthropic 的 API 端点(支持一键复制)。
  • Usage:按 API Key 维度的用量统计,谁用了多少 Token,一目了然。


视觉生产力:OpenAI 图像 API 与 .NET 10

除了大语言模型,1.9.0 还补齐了视觉能力:

  • 实现了标准的 OpenAI 图像生成(/v1/images/generations)和编辑(/v1/images/edits)API。
  • 配合前端的 ChatInput 动画优化,现在的图片生成体验更加流畅。

最后,作为一个 .NET 信仰粉,Chats 1.9.0 已经全线升级到了 .NET 10。虽然用户感知不强,但这带来了更好的性能和更现代的底层设施,为未来的长远发展打下了基础。


结语:为了更自由的 AI 网关

从 1.7 的 MCP 落地,到 1.9 的 Anthropic 原生支持与 API 兼容,Chats 正在一步步从一个“聊天网页”进化成一个真正通用的 AI 基础设施

那个 200 美元的账单虽然让人心痛,但它换来了 Chats 对 Claude 的完美支持,以及那段“为了测试而疯狂调用”的激情时光,我觉得——值了!

另外相信我,我做了一切努力尝试联系微软和 Anthropic,争取把那 200 美元的费用给要回来,但他们互相推诿,也没说是用户自己的行为或者平台责任,只是互相说这是对方(微软/Anthropic)的责任,所以最后也就不了了之了。

感谢阅读!喜欢的朋友请给我的 GitHub 项目一个 star:https://github.com/sdcb/chats

这是完整的更新日志:https://github.com/sdcb/chats/blob/main/doc/zh-CN/release-notes/README.md

有什么想法也欢迎在评论区留言交流,也欢迎加入我的新创建的微信群:

如果你更习惯用 QQ 的话,也可以加入 Chats QQ 群:498452653,我们一起探索更多 AI 技术硬核玩法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1193518.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Emotion2Vec+ Large降本部署案例:低成本GPU方案节省40%算力

Emotion2Vec Large降本部署案例:低成本GPU方案节省40%算力 1. 背景与挑战:语音情感识别的落地难题 在智能客服、心理评估、车载交互等场景中,语音情感识别正变得越来越重要。Emotion2Vec Large 是目前开源领域表现最出色的语音情感识别模型…

B站字幕智能提取:5分钟掌握视频文字内容高效获取完整指南

B站字幕智能提取:5分钟掌握视频文字内容高效获取完整指南 【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC字幕及转换的工具; 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle 还在为手动整理B站视频字幕而烦恼&#xff1…

CF1527C Sequence Pair Weight 题解

题意简析 计算给定序列的所有字段权值和,权值定义为有相同数值的下标对数。 思路解析 首先考虑到枚举,一个长度为 \(n\) 的序列,总共可以产生 \(n^2\) 数量级的子序列,子序列的最长长度为 \(n\),时间复杂度为 \(O…

2026年geo公司推荐:基于行业应用实测评价,针对品牌可见性痛点精准指南

研究概述 在生成式人工智能深度重构信息分发与获取模式的当下,企业品牌在AI对话答案中的可见性与权威性,已迅速演变为关乎生存与增长的全新战略要地。生成式引擎优化(GEO)作为应对这一范式转移的关键技术服务体系,…

2026年无缝钢管推荐:多行业应用实测评价,针对质量与交付痛点精准指南

摘要 在工业制造与基础设施建设领域,无缝钢管作为关键的承压与输送部件,其选型决策直接关系到项目的安全性、经济性与长期稳定运行。当前,采购决策者普遍面临一个核心挑战:如何在纷繁复杂的供应商市场中,精准识别…

无缝钢管供应商哪家强?2026年无缝钢管推荐与排名,解决定制化与时效性痛点

摘要 在工业制造与基础设施建设领域,无缝钢管作为关键的承压与输送部件,其选型直接关系到项目的安全性、可靠性与全生命周期成本。决策者,尤其是能源、化工、重型机械等行业的采购与工程负责人,正面临着一个日益复…

2026年知名的钢板预处理线工厂怎么选?推荐几家

在2026年选择钢板预处理线工厂时,应优先考察企业的技术积累、市场口碑、设备性能及售后服务能力。行业的厂家通常具备自主研发能力、稳定的国际客户群及成熟的自动化解决方案。其中,大丰市腾飞抛丸除锈设备有限公司凭…

通过原生集成的 AI 智能体(AI Agents),Oracle Cloud ERP 实现了流程自动化、预测性洞察生成和主动式风险控制

Oracle 在 2025 年 Gartner 面向服务导向型与产品导向型企业云 ERP 的两份魔力象限™报告中再次被评为“领导者”,彰显其在 AI 驱动财务转型领域的持续领先地位。依托 Oracle Fusion Cloud ERP,Oracle 将自主驱动型 AI 深度嵌入企业运营核心,…

如何为工程项目选无缝钢管?2026年无缝钢管全面评测与推荐,直击标准与适配痛点

摘要 在工业制造与重大基础设施建设领域,无缝钢管作为关键的承压、输送与结构材料,其选型与采购决策直接关系到项目的安全性、经济性与长期运行可靠性。对于项目采购负责人、设备工程师及供应链管理者而言,面对市场…

2026年无缝钢管推荐:长期合作稳定性排名,涵盖定制与标准品供应场景

摘要 在工业制造与重大基础设施建设领域,无缝钢管作为关键的承压与流体输送部件,其选型与采购决策直接影响项目的安全性、长期运行成本与整体工程进度。当前,决策者普遍面临如何在众多供应商中,精准识别出兼具产品…

5分钟部署FSMN-VAD离线语音检测,轻松实现长音频自动切分

5分钟部署FSMN-VAD离线语音检测,轻松实现长音频自动切分 你是否经常被冗长的录音文件困扰?手动剪辑语音片段耗时费力,而背景噪音和静音段又严重影响后续识别效率。有没有一种方法能自动“听懂”哪里在说话、哪里是空白?答案就是语…

2026年1月塑封机品牌推荐排行榜单:五大品牌综合对比与选购深度评测

一、引言 在办公文印、影像输出以及文档长期保存等多个专业及日常场景中,塑封机扮演着至关重要的角色。其核心价值在于通过覆膜工艺,为文件、照片等纸质材料提供防水、防污、防褪色及增强硬度的保护,从而延长其使用…

【Docker部署MySQL终极指南】:从零开始掌握数据卷挂载核心技术

第一章:Docker部署MySQL的核心价值与场景解析在现代软件开发与运维体系中,容器化技术已成为服务部署的主流方式。Docker凭借其轻量、可移植和环境一致性等优势,为数据库服务如MySQL的部署提供了全新范式。通过容器化MySQL实例,开发…

GEO优化哪家强?2026年GEO公司排名与推荐,解决技术适配与数据安全痛点

摘要 在生成式人工智能深度重构信息分发与获取规则的今天,企业品牌在AI对话答案中的“可见性”与“权威性”已取代传统搜索引擎排名,成为关乎生存与增长的全新战略要地。对于企业的决策者与技术负责人而言,如何在纷…

千亿token时代的信息处理新范式

一、千亿token时代的到来:从量变到质变的信息革命在2025至2026年的短短一年间,中国大模型市场完成了从“模型参数竞赛”到“token消耗竞争”的核心转型,token调用量已成为衡量企业AI化深度与商业化落地成效的核心指标。所谓token,…

阴阳师自动挂机神器:解放双手轻松刷御魂

阴阳师自动挂机神器:解放双手轻松刷御魂 【免费下载链接】yysScript 阴阳师脚本 支持御魂副本 双开 项目地址: https://gitcode.com/gh_mirrors/yy/yysScript 还在为每天重复刷御魂而烦恼吗?yysScript阴阳师自动挂机脚本为您带来全新的游戏体验&a…

2026年1月塑封机品牌推荐排行榜:五大品牌客观对比与深度评测分析

一、引言 在办公文印、影像制作以及各类文档保存领域,塑封机作为关键的印后处理设备,其重要性不言而喻。对于广大的中小型企业采购者、图文店经营者以及专业摄影师而言,选择一台合适的塑封机,直接关系到工作效率、…

2026年1月塑封机品牌推荐排行榜:五大品牌综合对比与选购深度

一、引言 在办公文印、影像制作以及各类文档资料长期保存的领域,塑封机作为关键的印后处理设备,其重要性不言而喻。对于广大的中小型企业采购者、图文快印店经营者以及有大量文件塑封需求的机构用户而言,选择一台合…

人像模糊也能转卡通?unet低质量图片处理能力实测案例

人像模糊也能转卡通?unet低质量图片处理能力实测案例 你有没有遇到过这种情况:手头只有一张模糊的旧照片,想做成卡通头像却被告知“画质太差,无法处理”?今天我们要测试的这个AI工具——基于UNet架构的人像卡通化模型…

Unlock-Music音乐解锁完整指南:3步轻松解决加密音乐播放限制

Unlock-Music音乐解锁完整指南:3步轻松解决加密音乐播放限制 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址:…