任务分解与小模型如何降低AI成本

news/2025/10/20 13:38:43/文章来源:https://www.cnblogs.com/codeshare1135/p/19148629

任务分解与小型语言模型如何让AI更经济

生成式AI应用的广泛使用增加了对准确、经济高效的大型语言模型需求。LLM的成本因其规模差异显著,通常以参数数量衡量:切换到更小规模的模型通常可节省70%-90%成本。然而,仅使用更小、更轻量级的LLM并非总是可行方案,因为与最先进的"前沿LLM"相比,它们的能力有所减弱。

专业化小模型的潜力

虽然参数减少通常会降低性能,但有证据表明,专门用于执行问答或文本摘要等任务的小型LLM,在这些相同任务上可以匹配未经修改的大型前沿LLM的性能。这为通过将复杂任务分解为更小、可管理的子任务来平衡成本和性能提供了可能性。

这种任务分解使得能够使用经济高效、更小、更专业的任务或领域适配LLM,同时提供控制、增强故障排除能力,并可能减少幻觉。然而,这种方法存在权衡:虽然可以带来显著的成本节约,但也会增加系统复杂性,可能抵消部分初始收益。

任务分解实践

理想情况下,任务将被分解为彼此独立的子任务。这允许为每个子任务创建有针对性的提示和上下文,通过将故障隔离到特定子任务来简化故障排除,而不需要分析单个大型黑盒过程。

然而,有时无法分解为独立子任务。在这些情况下,可能需要提示工程或信息检索来确保子任务间的连贯性。但应避免过度工程化,因为它可能不必要地复杂化工作流程,并可能牺牲LLM通过捕捉原始任务完整上下文中的隐藏关系所能提供的新颖性和上下文丰富性。

案例研究:个性化网站生成

在示例场景中,某机构希望创建一个网站构建器,为个体访问者生成定制化的网页体验,无需人工监督。生成式AI的创造性和在不确定性下工作的能力使其适合此任务。

该解决方案将整个过程分解为通常分配给人工代理类型的子任务,如个性化器(UX/UI设计师/产品经理)、艺术家(视觉艺术创作者)和网站构建器(前端开发人员)。

个性化器代理旨在通过考虑访问者个人资料以及公司政策、产品和服务、设计方法来提供定制化体验。这是一个具有推理能力的中等规模文本到文本LLM。该代理还结合了检索增强生成来利用经过审查的"公司研究"。

艺术家代理的角色是将视觉元素描述反映在明确定义的图像中,无论是背景图像还是图标。文本到图像提示更直接,以"创建[从个性化器响应中提取]"开始。

前端开发人员代理的唯一职责是创建前端网站工件。在这里可以包含设计系统、代码片段或其他相关信息。

复杂度权衡与过度工程陷阱

任务分解通常引入额外组件(新LLM、协调器),增加复杂性并带来开销。虽然小型LLM可能提供更快的性能,但增加的复杂性可能导致更高的延迟。

用O(n)表示任务复杂度,其中n是任务规模。使用单个LLM时,复杂度随任务规模线性增长。而在具有k个子任务和k个小型语言模型的并行任务分解中,初始分解具有恒定复杂度O(1)。假设均匀分布,每个k个语言模型处理其分配的子任务,复杂度为O(n/k)。

处理完成后,来自k个语言模型的结果需要协调和集成。此步骤的复杂度是O(km),其中完全成对协调给出m=2,但实际上1<m≤2。

因此,使用多语言模型进行任务分解的整体复杂度可表示为:Ok-LLMs = O(1) + k(O(n/k)) + O(km) → O(n) + O(km)

虽然单语言模型方法的复杂度为O(n),但多语言模型方法由于协调和集成开销引入了额外项O(km),其中1<m≤2。

成本与复杂度的思维模型

决定是否使用任务分解的一个有用思维模型是考虑应用程序的估计总拥有成本。随着用户群的增长,基础设施成本变得主导,而任务分解等优化方法可以降低TCO,尽管存在前期工程和科学成本。

对于较小的应用程序,选择大型模型等更简单的方法可能更合适且更具成本效益。

平衡创新与简化

任务分解和使用小型LLM创建代理工作流可能以牺牲更强大模型通常展示的新颖性和创造性为代价。通过"手动"将任务分解为子任务并依赖专门模型,整体系统可能无法捕捉从更整体方法中出现的意外联系和新颖见解。

此外,为特定子任务制作复杂提示的过程可能导致过度复杂和繁琐的提示,这可能有助于降低准确性和增加幻觉。

使用多个、更小、精细调整的LLM进行任务分解为提高复杂AI应用的成本效率提供了一种有前景的方法,与使用单一大型前沿模型相比,可能提供显著的基础设施成本节约。然而,必须注意避免过度工程,因为过度分解可能增加复杂性和协调开销,导致收益递减。在成本、性能、简单性和保留AI创造性之间找到适当平衡将是释放这一有前景方法全部潜力的关键。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/939078.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spring事件监听的核心机制

spring事件监听的核心机制Spring 事件监听机制的核心是基于观察者模式(Observer Pattern) 实现的组件间解耦通信机制,通过事件(Event)、监听器(Listener)、事件发布者(Publisher) 三者的协作,实现 “发布 - …

直播软件开发搭建公司

作为专ye的直播软件开发公司,山东(泰安)布谷鸟网络科技有限公司深耕直播软件开发和搭建业务,致力于为客户提供稳定、高效的直播解决方案,推出布谷直播源码,满足不同业务场景的定制需求。本文将从多个角度解析直播软…

freeswitch的proxy_media模式下video流的问题与修正

概述 freeswitch是一款简单好用的VOIP开源软交换平台。 测试过程中发现fs的proxy_media模式的一个bug,就是video媒体流的转发处理有问题。 环境 CentOS 7.9 freeswitch 1.6.20 问题 fs配置为proxy_media模式,A路发起…

DNS 相关

dig 使用 背景 example.com 是一个公网注册的域名,在阿里云配置权威DNS解析,本地内网服务器也搭建了一个bind server同样配置了example.com的zone解析该域名,本地所有ECS的/etc/resolv.conf 配置的 nameserver为 10…

2025 年无锡专线物流公司最新推荐排行榜:聚焦个性化运输解决方案,精选优质服务商往返无锡/冷链无锡/公路无锡/大件无锡专线物流公司推荐

当前工业生产节奏持续加快,无锡地区企业对专线物流定制服务的需求愈发多样化、精细化,涵盖往返运输、冷链配送、大件机械运输等多个细分场景。然而,物流市场中企业资质、服务能力参差不齐,部分服务商存在定制方案不…

Dubbo入门-通过spring-boot来动手实践

第一种--快速创建应用 可以直接下载示例项目,链接:https://github.com/apache/dubbo-samples/tree/master/11-quickstart 第二种--新建项目 新建 Java 空白 Maven 项目jdk17之后我们还需要创建 dubbo-spring-boot-de…

使用ceph rdb做k8s后端存储(ceph-csi storageclass

环境:Os:Centos 7k8s:v1.28 ceph:14.2.22###############################################ceph端分配存储##############################1.分配osd pool和创建用户[root@master tmp]#ceph osd pool create dynamics-…

2025 最新火烧板源头厂家推荐排行榜:自有矿山加持 + 品质卓越,芝麻灰 / 五莲花等石材采购优选指南

当前火烧板市场面临多重采购困境:部分厂家缩减生产流程导致产品色泽不均、质地松软,难以适配建筑与装修行业的高品质需求;多数中小型商家缺乏自有矿山,原材料依赖外购,常因供应中断或品质波动延误工程进度;加工精…

【IEEE出版、吉首大学主办】第二届智能机器人与自动控制国际学术会议 (IRAC 2025)

第二届智能机器人与自动控制国际学术会议 (IRAC 2025) 2025 2nd International Conference on Intelligent Robotics and Automatic Control 在这里看会议官网详情 中国-吉首 | 2025年11月28日-30日 收录类型:IEEE …

第三次课动手动脑合集

链接:https://files.cnblogs.com/files/blogs/847696/动手动脑3.zip?t=1760694634&download=true编译错误的原因是:在Test类的main方法中,尝试创建Foo类的对象obj1时,没有传递任何参数。但Foo类定义了一个带参…

2025 年火山石厂家最新推荐排行榜:聚焦自有矿藏与全自动生产,涵盖滤料填料等多品类企业权威指南人工湿地填料/人工湿地滤料/黑色/红色火山石厂家推荐

当前火山石应用已广泛覆盖污水处理、人工湿地、园林造景等多个领域,市场需求持续攀升,但采购端却面临诸多困境。不少采购方因缺乏专业判断,难以辨别厂家资质,常遭遇原料不稳定导致的产品性能波动、生产设备落后引发…

mysql5.7.44升级到8.0.34 mysql跨版本升级实战操作 windows环境

mysql5.7.44升级到8.0.34 mysql跨版本升级实战操作 windows环境背景 服务器当前数据库版本为mysql5.7.22 通过小版本直接升级到mysql5.7.44 (5.7.44是当前大版本最新状态);然后我们通过mysql5.7.44 可直接升级到my…

【SPIE出版、往届已检索】第十届能源系统、电气与电力国际学术会议 (ESEP 2025)

ESEP 2025已通过SPIE - The International Society for Optical Engineering (ISSN: 0277-786X)出版审核,EI 见刊检索稳定! 第十届能源系统、电气与电力国际学术会议 (ESEP 2025) 2025 10th International Conferenc…

2025 防火隔断厂家最新推荐排行榜:甲级防火玻璃隔断厂家深度测评,精选优质品牌助力采购决策

引言随着建筑行业对防火安全的要求日趋严苛,防火隔断作为关键防护设施,市场需求持续攀升,但行业乱象却让采购者陷入困境。部分品牌缺乏核心技术,产品耐火性能不达标,无法在火灾中有效阻隔火势与有毒烟气;新兴品牌…

2025-10-17

2025-10-17今天测试新写的npc,发现参考的那个微架构图有问题(或者说还不够完善),修改之后dummy测试程序通过了,但是add测试程序有问题,发现一直在死循环。这一刻我才意识到cpu出了问题调试起来会有多难受,这还是…

2025 年最新推荐!国内优质球墨铸铁管厂家排行榜,涵盖市政 / 给水 / 水利工程用管,助力采购高效选材

当前基础设施建设对球墨铸铁管需求持续增长,但市场品牌繁杂、质量参差不齐,部分产品存在抗压性不足、防腐性能差等问题,给工程质量埋下隐患。采购方在选择时,常因缺乏专业鉴别能力,难以精准挑选适配市政、给水、水…

Nexpose 8.24.0 for Linux Windows - 漏洞扫描

Nexpose 8.24.0 for Linux & Windows - 漏洞扫描Nexpose 8.24.0 for Linux & Windows - 漏洞扫描 Rapid7 on-prem Vulnerability Management, released Oct 15, 2025 请访问原文链接:https://sysin.org/blog/…

有趣评测小程序系统:开启视频与答题变现新创业风口

在当下小程序创业热潮中,一款兼具实用性与盈利性的工具成为众多创业者的迫切需求。有趣评测小程序系统作为 “天天变现” 的配套小程序,凭借答题与视频变现的核心功能,依托微擎系统实现便捷交付,为微信小程序创业者…

看图猜成语达人小程序:一站式趣味与变现解决方案

在小程序生态蓬勃发展的当下,兼具娱乐性与商业价值的应用成为市场热点。“看图猜成语达人” 小程序依托微擎系统,融合经典成语文化与创新互动模式,不仅为用户带来沉浸式猜谜体验,更为主理人提供低门槛、高潜力的流…