在人工智能(AI)与移动计算深度融合的背景下,边缘计算逐步成为新一代智能服务基础架构的核心。在这一浪潮中,微算法科技(NASDAQ:MLGO)推出一种具有批处理功能的边缘服务器实现多用户协同推理技术,这项技术不仅提供了面向多用户、能耗敏感型设备的高效协同推理解决方案,还通过创新的批处理调度与任务划分算法,打破传统推理模式的限制,显著提升GPU资源利用率与系统整体吞吐能力。
在当前边缘智能化的大趋势下,移动终端设备的AI应用越来越丰富,从智能安防、增强现实,到车载AI助手,几乎无处不在。然而,这些终端设备往往受限于能耗与计算能力,难以独立高效完成深度神经网络(DNN)推理任务。尤其是在并发任务数量剧增的场景中,单设备完成所有计算将造成电量快速消耗和响应速度下降。因此,推理任务卸载成为缓解这些瓶颈的重要方向。将深度学习模型的推理阶段卸载至配备GPU的边缘服务器,不仅能释放终端计算资源,还可在保持较低延迟的同时提供近实时服务。
但传统卸载方案通常针对单用户场景,未充分考虑多个用户共享边缘服务器资源时的任务调度与负载均衡问题。在真实世界中,边缘服务器往往要同时响应数十、甚至数百个终端设备的推理请求。在这种多用户同时在线的场景下,如何高效地调度任务,最大限度地提升GPU并行计算能力,并在保障各用户延迟需求的同时最小化整体能耗,成为亟需解决的问题。
因此,微算法科技(NASDAQ:MLGO)提出了一种创新架构:将用户推理任务进一步拆分为多个细粒度的子任务,并利用GPU的批处理能力对多个用户的相同类型子任务进行统一聚合处理。这一思路源自于对GPU执行特性和神经网络推理结构的深入分析。在DNN模型中,推理通常由若干层组成,不同用户即便使用不同模型,也常存在可重用的结构(如卷积层、全连接层等),因此可以通过统一调度与分组机制,对同类任务进行并发批处理,从而提高资源利用率。
在系统设计方面,微算法科技研发团队引入独立划分与相同子任务聚合算法(Independent Partition and Same Subtask Aggregation,IP-SSA)技术。该算法的核心理念是:对于具有相同边缘推理延迟与相同服务级别协议的多用户群体,可将每个用户的推理任务独立划分为子任务,并将相同类别的子任务聚合在一个批次中处理。通过严格的理论推导,研究团队证明了这一策略在延迟恒定约束条件下是最优的。也就是说,在限定的响应时间内,IP-SSA 能够最小化总能耗并提升系统吞吐率,从而为批处理系统提供坚实的理论支撑。
然而,真实应用中用户请求的时延容忍度通常存在差异,特别是在服务等级协议(SLA)各异的情况下,这种差异可能导致传统聚合策略效率下降。为解决该挑战,微算法科技(NASDAQ:MLGO)进一步提出了最优分组算法(Optimal Grouping,OG)。OG算法通过对用户任务的延迟上限、任务计算强度和资源可用性建模,动态调整任务分组方式,确保在多样化时延约束下,任务依旧能高效进行批处理。这一算法不仅保留了IP-SSA的高并发调度能力,还能灵活适应不同的服务场景。
为适应动态场景下任务到达的不确定性,微算法科技(NASDAQ:MLGO)还在系统中引入了强化学习模型进行调度决策。通过训练深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)代理,系统能够在运行中自适应学习最优调度策略。具体来说,当预测模型无法精确获得未来任务分布时,DDPG代理根据当前状态选择是否使用OG算法进行任务分组,或选择直接按照任务类型即时调度。此机制大幅提升了系统的鲁棒性与在线部署适应能力。
微算法科技该系统的核心包括三大模块:任务划分模块、任务聚合与分组模块,以及调度策略优化模块。任务划分模块将原始DNN模型转换为可卸载的子任务图,并结合端设备的功耗模型进行代价建模;任务聚合与分组模块利用IP-SSA和OG策略,根据任务特征和延迟需求进行批处理组织;而调度策略优化模块则通过强化学习驱动的控制器进行在线调度,从而在实际运行中持续优化资源利用与服务质量。
系统在多个边缘计算实验平台上进行了测试,分别对图像识别与目标检测实验,覆盖智能摄像头、移动终端、智能车载设备等典型场景。结果表明,与传统推理卸载系统相比,该系统在保持推理精度的前提下,实现了平均47.8%的能耗下降,并提升了42.5%的任务吞吐量。在多用户并发数大于50的场景中,系统仍能维持稳定的延迟控制能力,有效避免了因GPU任务拥塞带来的性能下降。
此外,微算法科技该系统支持多种部署模型,包括本地私有边缘云、区域型MEC(移动边缘计算)平台、以及融合5G网络的边缘服务节点。这种灵活部署能力,使其可广泛应用于智能制造、智能城市、智慧医疗等对响应时间与能效有严格要求的行业中。
微算法科技(NASDAQ:MLGO)计划将该系统进一步扩展为通用的AI卸载平台,支持多模态数据协同推理任务(如图像、语音、文本融合分析),并与边缘数据缓存系统集成,实现“感知—分析—执行”一体化AI服务。此外,系统的调度核心也将在联邦学习与安全多方计算框架下进行强化,以适应更高等级的隐私保护和数据隔离需求。
作为边缘AI领域的重要突破,微算法科技这项具有批处理功能的边缘服务器实现多用户协同推理技术,不仅是算法与系统工程的深度融合,更为边缘智能生态带来一套系统化的性能优化方案。在全球AI应用场景爆发增长的今天,这项技术将引领新一代边缘智能基础设施的建设潮流,为构建更加绿色、高效、智能的计算未来提供坚实支撑。