降薪跳槽,投身开源!只为 AI 落地“最后一公里”

news/2025/11/5 8:19:52/文章来源:https://www.cnblogs.com/xueweihan/p/19191197

2022 年底,一个 AI 项目上线的深夜。

作为大厂的资深 AI 算法部署工程师,Always 刚完成了第 N 个从算法到上线的项目。他没有喜悦,反而盯着屏幕陷入了沉思。他发现,所有 AI 落地项目,本质上都在重复同一套繁杂的流程——无非是换了模型和业务逻辑。这个过程,正是业内最头痛的AI 落地最后一公里

“为什么我们要在这些重复的事情上,浪费这么多时间?”

一个念头在他脑中升起:能不能把这套流程彻底抽象成一个通用框架?拖拽⼯作流+有向⽆环图+多端推理⸺这个技术⽅案在他的脑海⾥逐渐清晰。为了实现这个想法,他做出了一个在外人看来“不太理智”的决定:主动降薪 40%,跳槽到一家 955 的公司,从而有更多的时间和精力,把这个框架做出来,并把它开源!

于是,nndeploy 诞生了!

这是一款专为 AI 落地最后一公里 而生的易用、高性能端侧 AI 部署框架。它通过可视化⼯作流降低⻔槛,统⼀接⼝搞定多端推理,并提供 LLM、AIGC、换脸、目标检测、图像分割等开箱即用的 AI 模型部署配置文件。让 AI 落地,从数周缩短至几天

GitHub 地址:github.com/nndeploy/nndeploy

一、AI 落地:被忽视的“最后一公里”

很多人可能会问:AI 落地还不简单?不就是调个 API 吗?

如果真是这样,那 nndeploy 这种部署框架岂不是多此一举?

尤其是在端侧(On-Device)——也就是手机、汽车、摄像头这些设备上——这个问题的答案尤其清晰:还真不行

试想一下:自动驾驶汽车在高速上需要紧急刹车,它能等待一个网络 API 返回结果吗?工厂的质检摄像头,能忍受零点几秒的网络延迟吗?更不用说,当你的手机需要人脸解锁时,你敢把自己的信息毫无保留地传到云端吗?

延迟、隐私、成本——这三座大山,让端侧部署成为 AI 落地的重要阵地,进一步拓宽了应用的边界。

而 AI 部署工程师的“战场”,就是要把那些“聪明模型”塞进各种资源受限的设备中。他们面对的是发热的芯片、有限的算力、以及五花八门的操作系统……他们是把 AI 从“实验室”带到更多人身边的幕后英雄。

这批工程师也是 AI 开发岗位中需求量大、门槛相对较低、薪资也同样可观的主流“AI 饭碗”。

而这,也正是 Always(nndeploy 发起人)想解决的另一个核心问题。他希望 nndeploy 不仅是一个 AI 部署框架,更能为那些想从软件工程师转型到 AI 部署的开发者,提供一套开箱即用的“武器库”

二、nndeploy:助力 AI 部署工程师的每个阶段

nndeploy 为什么能成为 AI 部署工程师的“必备工具箱”?

秘诀在于:它为不同阶段的 AI 部署工程师量身打造了关键能力。

  • 新手友好:超低门槛的可视化工具,助你轻松入门。
  • 专业进阶:深度优化能力,助力打造高性能解决方案。
  • 高效实战:丰富算法库,兼顾效率与学习,开箱即用。

2.1 可视化“木剑”,轻松上手

nndeploy 的首要目标,是让 AI 落地变得前所未有的简单。对于转行或刚入门的工程师,它提供了极致直观的体验:

  • 可视化工作流:拖拽节点即可部署 AI 算法,参数实时可调,效果一目了然。
  • 自定义节点:无论是用 Python 实现预处理,还是用 C++/CUDA 编写高性能节点,均可无缝集成于工作流。
  • 一键多端部署:工作流支持导出为 JSON,可通过 C++/Python API 调用,适用于 Linux、Windows、macOS、Android、iOS 等平台。

2.2 高性能“屠龙刀”,攻克生产难题

在高性能需求下,nndeploy 是工程师手中的“屠龙刀”。它为资深从业者内置了面向“最后一公里”的深度优化:

  • 并行优化:支持串行、流水线并行和任务并行等多种执行模式。
  • 内存优化:零拷贝、内存池、内存复用等优化策略,专为端侧资源优化设计。
  • 高性能优化:内置 C++/CUDA/Ascend C/SIMD 等多种高性能节点实现。
  • 多端推理:支持 13+ 主流推理框架(TensorRT、ONNXRuntime、OpenVINO 等),无缝适配云、边、端全场景。

以 YOLOv11s 端到端工作流总耗时为例,串行 vs 流水线并行:

2.3 开箱即用的算法库,高效又好学

nndeploy 内含 100+ 常用节点,覆盖主流 AI 应用场景。无需反复造轮子,高频需求一键满足。丰富的案例也是最佳学习资料:拿来即用、跑通即会!

注:nndeploy 专注于端侧,仅支持参数量在 0.3B~7B 级别的大语言模型。

三、五分钟用上你的第一个 AI 应用

nndeploy 的上手体验到底有多丝滑?

无需复杂配置,5 分钟就能启动并部署一个 AI 应用。

1. 一键安装

pip install --upgrade nndeploy

2. 启动可视化编辑器

nndeploy-app --port 8000

启动成功后,打开 http://localhost:8000 即可进入工作流编辑器。在这里,你可以拖拽节点、调整参数、实时预览效果,所见即所得。

3. 保存并执行:从原型到生产

在可视化界面中搭建、调试完成后,点击保存,工作流就会导出为一个 JSON 文件

这个 JSON 文件就是你的 AI 应用,它封装了你所有的流程和逻辑。你可以用以下两种方式在生产环境中运行它:

方式 1:命令行一键执行

用于快速测试和验证。

# Python 命令行
nndeploy-run-json --json_file path/to/workflow.json
# C++ 命令行
nndeploy_demo_run_json --json_file path/to/workflow.json

方式 2:在 C++/Python 代码中加载

这才是最核心的用法。你可以将这个 JSON 文件无缝集成到你现有的 C++ 或 Python 项目中,以下是一个加载 LLM 工作流的示例代码:

Python 示例

graph = nndeploy.dag.Graph("")
graph.remove_in_out_node()
# 仅需加载导出的 JSON 文件
graph.load_file("path/to/llm_workflow.json")
graph.init()# 准备输入数据
input = graph.get_input(0)    
text = nndeploy.tokenizer.TokenizerText()
text.texts_ = [ "<|im_start|>user\nPlease introduce NBA superstar Michael Jordan<|im_end|>\n<|im_start|>assistant\n" ]
input.set(text)# 执行并获取结果
status = graph.run()
output = graph.get_output(0)
result = output.get_graph_output()  # 释放资源
graph.deinit()

C++ 示例

std::shared_ptr<Graph> graph = std::make_shared<Graph>("");
// 仅需加载导出的 JSON 文件
base::Status status = graph->loadFile("path/to/llm_workflow.json");
graph->removeInOutNode();
status = graph->init();// 准备输入数据
Edge* input = graph->getInput(0);
tokenizer::TokenizerText* text = new tokenizer::TokenizerText();
text->texts_ = {"<|im_start|>user\nPlease introduce NBA superstar Michael Jordan<|im_end|>\n<|im_start|>assistant\n"
};
input->set(text, false);// 执行并获取结果
status = graph->run();
Edge* output = graph->getOutput(0);
tokenizer::TokenizerText* result = output->getGraphOutput<tokenizer::TokenizerText>();// 释放资源
status = graph->deinit();

四、技术解读:如何实现简单且高性能?

nndeploy 通过将 AI 算法拆解为工作流节点进行部署,采用三层分离架构设计,整体结构如图所示:

三层架构详解如下:

计算执行层是 nndeploy 的高性能核心,由图执行引擎与多端推理两大模块组成:

  1. 图执行引擎:基于有向无环图(DAG)实现工作流调度,⽀持灵活的串⾏、任务并行、流水线并⾏和组合并行执⾏模式。
  2. 多端推理:统一封装 10 余种主流推理后端,提供跨平台推理能力。

整体架构如下图所示:

4.1 图执行引擎

Graph 本身继承自 Node,可作为子图嵌套,支持任意层级组合。图执行引擎包含三层抽象:

  • Graph(图):工作流容器,负责节点管理、拓扑排序与调度执行。
  • Node(节点):独立的计算单元。
  • Edge(边):节点间数据传递通道。

这种“图即节点”的设计,让用户像搭积木一样自由组合算法节点,构建复杂的 AI 工作流。支持以下执行模式:

  • 串行执行:按拓扑顺序逐节点执行。
  • 流水线并行:前处理、推理、后处理等环节并行,提升数据吞吐。
  • 任务并行:无依赖节点同时运行,缩短整体耗时。
  • 组合并行:支持嵌套,灵活组合各种并行方式,充分释放硬件性能。

4.2 多端推理

nndeploy 的多端推理模块为不同推理后端提供统一接口,开发者无需关心底层框架差异。例如,新增 MNN 推理后端的流程包括:

  1. 理解 MNN 的 API 和推理流程。
  2. 熟悉 nndeploy 的推理基类与超参数配置类。
  3. 编写适配器:继承推理基类实现适配逻辑、继承超参数类实现参数配置、实现数据转换⼯具函数。
  4. 基于新后端运行模型,验证功能完整性。

针对不同推理框架的数据交互方式(如 TensorRT 的 io_binding、OpenVINO 的 ov::Tensor、TNN 的 TNN::Blob),nndeploy 设计了统一的数据容器 TensorBuffer,彻底屏蔽底层差异。

同时,框架提供异构设备抽象层,统一不同硬件编程模型。目前已支持 CPU(X86、ARM)、GPU(CUDA)、NPU(如华为昇腾 AscendCL)等,让同一份代码可在多种硬件平台上高效运行,实现一次开发,多端部署

此外,框架内部还开发了推理子模块作为缺省推理框架,当用户环境未编译链接其他推理框架时可使用。模型支持方面,已适配图像分类(ResNet50)、目标检测(YOLOv11)、图像分割(RMBG1.4)等,目前正拓展大语言模型(LLM)推理支持并优化性能。

五、从一个人的想法到一群人的坚持

nndeploy 从最初的想法到正式开源,打磨了近一年。2023 年 8 月 28 日,nndeploy 第一个版本正式开源。当天就收到了 CGraph 作者 Chunel 的认可和热情推广,项目很快突破 100 Star。

随着 nndeploy 被越来越多开发者了解,一批认同其理念的小伙伴逐渐聚集起来。随后,csrdxka、youxiudeshouyeren、zhangzhaosen 等开发者加入,成为项目早期的核心贡献者,共同推动 nndeploy 的成长。

项目日益成熟后,nndeploy 也迎来了真实生产场景的考验:

  • 文档处理公司:用它搭建完整的 OCR 流水线。
  • 智能汽车企业:在座舱项目中部署 NLP 算法。
  • AI Box 公司:利用其多端能力部署边缘算法。

这些来自产业一线的真实应用和反馈,为 nndeploy 的持续迭代提供了宝贵的方向!

看到 nndeploy 如今在真实产业中落地开花,我尤其感慨,因为我见证了它一步步成长的全过程

六、写在最后

我认识 Always(nndeploy 发起人)时,他刚开始做开源不久。我们成为朋友,也是在某个凌晨,两个人大晚上打字聊了 3 小时。我们聊开源、聊理想、也聊 nndeploy。那时的 nndeploy,还只是一个纯后端框架——“黑框框”。我认真地对他说:“你得做可视化,门槛才能真正降下来。”

他只回了一个“好”。然后,便从我的世界“消失”了近一年。

再次见到 nndeploy 时,他带着一个功能完整的可视化界面出现在我面前。那一刻的震撼,真的难以言表,我本以为他不会认真考虑我的建议,没想到他一直在默默做这个功能!我当即决定将 nndeploy 收录到《HelloGitHub》月刊,因为它具备了我认为优秀开源项目最关键的两点:长期主义和源于自身需求

此后,我们又花了四个月打磨这篇文章,终于可以将 nndeploy 及其背后的开源故事分享给大家。

GitHub 地址:github.com/nndeploy/nndeploy

我看好 nndeploy 的未来,更相信 Always 对理想的坚持——打通 AI 落地的最后一公里


HelloGitHub 不仅分享有趣的开源项目,也希望挖掘开源背后的故事。我们期待通过代码与文字,凝聚一群热爱开源的小伙伴,共同打造一个有趣、有温度的开源社区!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/956299.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CCUT应用OJ——寻找X

题目简介题源:1079 - 寻找X | CCUT OJ 题意:给定仅包含 * 和 . 的二维矩阵,寻找由 * 所组成的最大的X形的臂长。 数据范围:\(1\le n,m\le 100\)题解 想法非常简单,遍历整个矩阵,将每个点都是为X的可能中心向四周…

2025年比较好的移动式火车水泥散装设备厂家最新热销排行

2025年比较好的移动式火车水泥散装设备厂家最新热销排行 随着全球基建和水泥行业的快速发展,移动式火车水泥散装设备的需求持续增长。这类设备在水泥运输、仓储和装卸环节中发挥着关键作用,能够显著提升效率并降低成…

2. markdown转word

1.简介 我们在上一章介绍了如果想实现将markdown内容转换为word的话, 如果想要转换后的word内容排版好看的话, 就需要将其转换过程分为两步markdown→html html→ooxml(Office Open XML) word内容,word元信息本身就是个…

2025年比较好的云南泡沫包装箱最新TOP厂家排名

2025年比较好的云南泡沫包装箱最新TOP厂家排名 泡沫包装箱因其轻便、隔热、防震等特性,广泛应用于水果、蔬菜、海鲜、松茸等产品的运输和储存。云南作为农业和特色产品大省,对泡沫包装箱的需求持续增长。2025年,云…

2025年热门的热风循环回火炉厂家最新推荐排行榜

2025年热门的热风循环回火炉厂家最新推荐排行榜在工业制造领域,热处理设备尤其是热风循环回火炉对产品质量起着决定性作用。随着2025年中国制造业升级计划的深入推进,市场对高性能、智能化热处理设备的需求持续增长。…

2025年热门的气力均化设备用户好评厂家排行

2025年热门的气力均化设备用户好评厂家排行 随着工业自动化水平的不断提升,气力均化设备在水泥、化工、电力等行业中的应用越来越广泛。2025年,市场对高效、节能、智能化的气力均化设备需求持续增长。为帮助用户快速…

2025年知名的热风循环回火炉优质厂家推荐榜单

2025年知名的热风循环回火炉优质厂家推荐榜单 行业概述 热风循环回火炉作为热处理设备的重要组成部分,广泛应用于机械制造、汽车零部件、轴承、工具模具等行业。随着工业技术的不断进步,市场对回火炉的控温精度、能…

2025年比较好的挂通垃圾车热门厂家推荐榜单

2025年比较好的挂通垃圾车热门厂家推荐榜单 随着城市化进程加快和环保政策趋严,垃圾收运设备市场需求持续增长。挂通式垃圾车因其高效、灵活的特点,成为市政环卫、物业小区等领域的重要选择。本文基于企业技术实力、…

2025年口碑好的套臂垃圾车用户口碑最好的厂家榜

2025年口碑好的套臂垃圾车用户口碑最好的厂家榜 随着城市化进程加快,环卫设备市场需求持续增长,套臂垃圾车因其高效、环保、智能化的特点,成为垃圾收运领域的主流选择。2025年,用户对产品的性能、服务及品牌口碑要…

lazarus 4.2/fpc 3.3.1 for win64绿色版整合安装包(2025-11-05更新)

lazarus 4.2/fpc 3.3.1 for win64绿色版整合安装包(2025-11-05更新)lazarus 4.2/fpc3.3.1(绿色整合版 2025-11-05)fpc使用trunk(3.3.1)的aa182cb14737fce742689f269210acfbc51e2b8d分支解压后首次运行时运行runlazarus…

2025年知名的索菲亚同款皮革门厂家最新TOP实力排行

2025年知名的索菲亚同款皮革门厂家最新TOP实力排行 随着家居行业对品质与设计需求的提升,皮革门作为高端定制家居的核心部件,其生产厂家的技术实力与工艺水平成为消费者关注焦点。本文基于2025年市场调研数据,从企…

2025年质量好的焊接加工最新TOP品牌厂家排行

2025年质量好的焊接加工最新TOP品牌厂家排行 焊接加工是制造业中不可或缺的关键环节,广泛应用于机械制造、建筑、能源、交通等领域。随着技术的不断进步,市场对焊接质量、精度和效率的要求越来越高。2025年,焊接加…

2025年比较好的非标设备焊接加工热门厂家推荐榜单

2025年非标设备焊接加工热门厂家推荐榜单 随着工业自动化与智能制造的快速发展,非标设备焊接加工行业的需求持续增长。优秀的焊接加工厂家不仅需要具备先进的技术设备,还需拥有丰富的行业经验与稳定的质量控制能力。…

实用指南:[01] Qt的UI框架选择和对比

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年评价高的低脂猫粮热门用户选择榜

2025年评价高的低脂猫粮热门用户选择榜随着宠物健康意识的提升,低脂猫粮已成为2025年宠物食品市场的热门品类。低脂配方不仅能帮助控制猫咪体重,还能预防胰腺炎、糖尿病等代谢性疾病。本文精选了5家在2025年用户评价…

2025年靠谱的猫粮热销品牌推荐榜

2025年靠谱的猫粮热销品牌推荐榜随着宠物经济的蓬勃发展,猫粮市场在2025年迎来了更加多元化和专业化的竞争格局。作为宠物主人,选择一款营养均衡、安全可靠的猫粮对猫咪的健康至关重要。本文将为您推荐2025年市场上最…

2025年口碑好的代加工皮革门品牌厂家排行榜

2025年口碑好的代加工皮革门品牌厂家排行榜在当今家居装饰行业,皮革门作为高端定制家居的重要组成部分,越来越受到消费者的青睐。优质的皮革门不仅能够提升整体家居档次,还能带来独特的触感和视觉效果。随着市场需求…

2025年比较好的轻奢开放式衣帽间收纳最受欢迎品牌榜

2025年比较好的轻奢开放式衣帽间收纳最受欢迎品牌榜随着生活品质的提升,轻奢开放式衣帽间已成为现代家居的重要组成部分。2025年,消费者对衣帽间收纳的需求更加注重功能性、美观性与个性化。开放式设计不仅便于取用衣…

2025年口碑好的轻奢开放式衣帽间收纳顶尖推荐榜

2025年口碑好的轻奢开放式衣帽间收纳顶尖推荐榜轻奢开放式衣帽间收纳市场概述随着现代家居理念的不断升级,开放式衣帽间已成为都市精英和品质生活追求者的首选。2025年轻奢收纳市场呈现出智能化、模块化和环保化的三大…

RabbitMQ中Consumer的可靠性 - 指南

RabbitMQ中Consumer的可靠性 - 指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco…