基于企业数据构建可扩展AI:Nemotron RAG与SQL Server 2025整合架构解析

在某中心Ignite 2025大会上,某中心SQL Server 2025的发布标志着企业级AI就绪数据库愿景的实现,为开发者提供了内置向量搜索和用于调用外部AI模型的SQL原生API等强大新工具。某机构已与某中心合作,将SQL Server 2025与某机构Nemotron RAG开源模型系列无缝连接。这使得能够在云端或本地的数据上构建高性能、安全的AI应用。

检索增强生成(RAG)是企业利用其数据最有效的方法。RAG将AI建立在实时专有数据之上,无需承担从头开始重新训练模型的巨大成本和复杂性。然而,RAG的有效性取决于计算密集的步骤,其中之一是向量嵌入生成。这在传统的CPU基础设施上造成了巨大的性能瓶颈。

规模部署的复杂性和模型灵活性的需求使这一挑战更加严峻。企业需要一系列嵌入模型来平衡不同任务的准确性、速度和成本。

本文详细介绍了解决此问题的新某机构参考架构。该架构基于SQL Server 2025和属于Nemotron RAG系列的Llama Nemotron Embed 1B v2构建。解释了这种集成如何允许直接从SQL Server数据库调用Nemotron RAG模型,将其转变为高性能的AI应用引擎。该实现基于某中心云和某中心本地部署,涵盖云上或本地的主要SQL Server使用场景。

利用Nemotron RAG和SQL Server 2025解决企业AI RAG挑战

将SQL Server 2025连接到灵活、加速的某机构AI引擎(通过Nemotron RAG),解决了企业AI RAG的核心挑战:性能、部署以及灵活性和安全性。

改善RAG性能瓶颈

该架构通过使用Llama Nemotron Embed 1B v2将嵌入生成从CPU卸载到某机构GPU,解决了主要的RAG性能瓶颈。这是一个用于创建高度准确嵌入的最先进开源模型,专为检索任务优化。它提供支持长上下文的多语言和跨语言文本问答检索,并优化数据存储。

Llama Nemotron Embed 1B v2是Nemotron RAG的一部分,Nemotron RAG是一个提取、嵌入、重排序模型集合,使用Nemotron RAG数据集和脚本进行微调,以实现最佳准确性。

在数据库方面,SQL Server 2025通过由原生向量距离函数驱动的向量搜索,提供无缝、高性能的数据检索。在本地托管嵌入模型时,可以消除网络开销并降低延迟,这是两个能带来性能改进的关键因素。

将AI模型部署为简单的容器化端点

部署环节是某机构NIM微服务发挥作用的地方。NIM微服务是预构建的、生产就绪的容器,旨在简化最新优化AI模型(如某机构Nemotron RAG)在任何某机构加速基础设施(无论是云端还是本地)上的部署。使用NIM,可以将AI模型部署为简单的容器化端点,无需管理复杂的库或依赖项。

此外,数据驻留和合规性问题通过由NIM微服务支持的本地托管模型得到解决。易用性是另一个关键优势。NIM的预构建特性与原生SQL REST API相结合,显著降低了学习曲线,使得将AI更贴近客户已有数据变得更加容易。

保持安全性和灵活性

该架构提供了一系列最先进的Nemotron RAG模型,同时将专有数据安全地保留在SQL Server数据库中。NIM微服务专为企业级安全性设计,并得到某机构企业支持的支持。NIM微服务与SQL Server之间的所有通信都使用端到端HTTPS加密进一步保护。

Nemotron RAG与某中心SQL Server 2025参考架构

Nemotron RAG和SQL Server 2025参考架构详细介绍了使用Llama Nemotron Embed 1B v2嵌入模型(作为NIM微服务交付)实现该解决方案的方法。这使得能够直接从某中心云或某中心本地的SQL Server上运行企业级、安全、GPU加速的RAG工作流。

有关此解决方案的完整代码、部署脚本和详细演练,请参阅某机构GitHub上的“某机构NIM with SQL Server 2025 AI on Azure Cloud and Azure Local”。

核心架构组件

图1显示了三个核心架构组件和流程基础,下文也对此进行了详细描述。

图1. 该架构由三个协同工作的核心组件组成

SQL Server 2025:AI就绪的数据库

该解决方案的基础是SQL Server 2025,它引入了两项变革性功能,充当数据库内AI的引擎:

  1. 原生向量数据类型:此功能能够安全地将向量嵌入与结构化数据直接存储在一起。它消除了对独立向量数据库的需求,简化了架构,减少了数据移动,并支持混合搜索,例如查找既是“跑鞋”(向量搜索)又“有库存”(结构化筛选)的产品。
  2. 向量距离搜索:现在可以使用内置函数直接在SQL Server 2025内执行相似性搜索。这使得能够根据嵌入空间中的接近程度对结果进行排序,从而实现语义搜索、推荐系统和个性化等用例——所有这些都无需离开数据库。
  3. 创建外部模型:在SQL Server 2025中将外部AI模型(例如NIM微服务)注册和管理为一类实体。这提供了一种无缝编排推理工作流的方式,同时保持治理和安全性的集中。
  4. 生成嵌入:使用AI_GENERATE_EMBEDDINGS函数直接从T-SQL为文本或其他数据创建嵌入。该函数在底层利用调用外部REST API,无需复杂的集成步骤即可实现实时嵌入生成。
某机构NIM微服务:加速的AI引擎

Nemotron RAG系列开源模型,包括本参考架构中使用的Llama Nemotron Embed 1B v2模型,均作为生产就绪的某机构NIM微服务交付,运行在标准Docker容器中。

这种方法简化了部署,并确保在带有某机构GPU的云和本地Windows或Linux环境中的兼容性。这些模型可以部署在某中心容器应用或使用某中心本地的本地环境中。这种容器化交付支持自动和手动扩展策略,并为与SQL Server 2025一起使用提供了理想的“从地到云”灵活性。

  • 云规模:可以将NIM微服务部署到带有无服务器某机构GPU的某中心容器应用。这种方法抽象了所有基础设施管理。可以获得按需、GPU加速的推理,能够扩展到零并按秒计费,从而优化成本并简化操作。
  • 本地部署:为了获得最大的数据主权和低延迟,可以在本地使用某中心本地和某机构GPU运行相同的NIM容器。某中心本地将某中心的管理平面扩展到自有硬件,使能够直接针对本地数据运行AI,同时满足严格的合规性或性能需求。
SQL Server与NIM微服务之间的链接

SQL Server与NIM微服务之间的通信桥梁简单而稳健,建立在标准、安全的网络协议之上。

  • 兼容OpenAI的API:某机构NIM公开一个兼容OpenAI的API端点。这使得SQL Server 2025能够使用其原生函数调用NIM服务,就像调用OpenAI服务一样,确保了无缝、开箱即用的集成。
  • 标准POST请求:SQL Server 2025发出标准的HTTPS POST请求来获取结果(如嵌入)。
  • 安全灵活的通信:该设计使用TLS证书进行端到端加密,建立相互信任,并确保所有响应对于云端和本地部署都是安全、高性能且符合标准的。与仅远程模型相比,这提供了显著优势,因为保留了完全控制权,专有数据永远不会离开安全环境。

虽然此参考架构展示了最先进的Nemotron RAG模型,但它可以扩展,使SQL Server 2025能够调用任何NIM微服务,为广泛的AI应用提供支持——例如文本摘要、内容分类或预测分析——所有这些都在SQL Server 2025中的数据上直接执行。

两种部署方法

本文涵盖此解决方案的两种主要部署模式:本地部署(使用某中心本地)和云端部署(使用某中心容器应用)。两种模式都依赖于相同的核心机制:SQL Server 2025使用标准的兼容OpenAI的协议调用某机构NIM微服务端点。

使用某中心本地进行本地部署

本地部署确保了最大的灵活性,支持在NVIDIA GPU服务器上运行的Windows和Linux系统的实际组合,例如:

  • 同时运行SQL Server和某机构NIM的Windows/Ubuntu Server或Windows/Ubuntu本地虚拟机
  • 运行SQL Server的Windows和运行某机构NIM的Ubuntu,反之亦然

要进行部署,可以利用某中心本地,这是某中心的新产品,将某中心云平台直接扩展到本地环境。有关建立安全通信(包括NIM部署详细信息)的完整安装说明,请访问某机构GitHub上的“NVIDIA/GenerativeAIExamples”仓库。请注意,此解决方案使用SQL Server 2025(RC 17.0.950.3)进行了验证。

云端部署

云端部署利用托管在某中心容器应用(ACA,某中心Azure完全托管的无服务器容器平台)上的某机构Llama Nemotron嵌入NIM。ACA完全支持并扩展了所提议架构的优势。要了解更多信息,请参阅某机构GitHub仓库“NVIDIA/GenerativeAIExamples”上的“NVIDIA NIM with Microsoft SQL Server 2025 AI on Azure Cloud and Azure Local”。

这种无服务器方法为在SQL Server 2025中存储数据的AI应用部署提供了几个关键优势。

为了加速NIM副本启动,建议使用由某中心文件共享或临时存储支持的ACA卷来持久化本地NIM缓存。副本数量通过ACA HTTP自动扩展进行管理,允许扩展到零。

ACA应用可以并行托管多个版本和类型的NIM,每个版本和类型都可通过在SQL Server中配置的不同URL进行访问。

解决方案演示

要获取运行完整端到端工作流的完整说明,请查看演示“SQL Server 2025 AI functionality with NVIDIA Retrieval QA using E5 Embedding v5”。

具体来说,演示SQL脚本将指导完成以下步骤:

  1. 创建AdventureWorks示例数据库
  2. 创建ProductDescriptionEmbeddings演示表
  3. 执行演示脚本,通过某机构NIM集成填充嵌入
  4. 使用Select_Embeddings.sql验证和可视化存储的嵌入

此工作流演示了新的SQL Server 2025 AI功能,使用了内置的T-SQL AI功能VECTOR_DISTANCEAI_GENERATE_EMBEDDINGSCREATE EXTERNAL MODEL,这些构成了SQL Server 2025中新AI集成的基础。

开始使用SQL Server 2025和某机构Nemotron RAG

某中心SQL Server 2025与某机构Nemotron RAG(作为生产级某机构NIM微服务交付)的集成,为构建高性能AI应用提供了一条无缝的“从地到云”路径。通过将SQL Server 2025内置的AI功能与某机构GPU优化的推理堆栈相结合,现在可以解决主要的RAG性能瓶颈,将AI直接带到其数据中——安全、高效,且无需管理数据管道的操作复杂性。

这种联合参考架构展示了如何构建能够直接在SQL Server 2025内生成嵌入、执行语义搜索和调用推理服务的RAG应用。这种方法提供了部署最先进模型(如某机构Nemotron)的灵活性,无论数据位于何处——在某中心云上还是在带有某中心本地的本地——同时保持完全的数据主权。

准备好开始构建了吗?通过某机构GitHub上的“NVIDIA NIM with Microsoft SQL Server 2025 AI on Azure Cloud and Azure Local”仓库,获取适用于云端和本地场景的所有部署脚本、代码示例和详细演练。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1163924.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学霸同款2026继续教育一键生成论文工具TOP9测评

学霸同款2026继续教育一键生成论文工具TOP9测评 2026年继续教育论文写作工具测评:为何需要一份权威榜单? 在当前继续教育领域,论文撰写已成为学员提升学历、获取证书的必经之路。然而,面对繁重的工作与学习压力,许多学…

Java版LeetCode热题100之搜索二维矩阵 II:从暴力到最优解的完整解析

Java版LeetCode热题100之搜索二维矩阵 II:从暴力到最优解的完整解析 本文全面剖析 LeetCode 第240题「搜索二维矩阵 II」,涵盖题目理解、多种解法实现、复杂度分析、面试技巧及实际应用场景。无论你是准备面试的新手,还是希望深入理解算法优化…

C/C++ 将char[] 打印成二进制

逐字节打印成二进制: void print_char_to_binary(char chr) {for (int i 7; i > 0;i--) {char bit (chr >> i) & 1;printf("%d", bit);}printf("\n"); }int main() {char data[] { 0x12,0x3a,0xff };int len 3;for (int i 0; i < len…

2小时,我搭了一套供应链全流程可视化系统,采购、计划、仓库终于对齐了

你是不是也遇到过这种情况&#xff1a;采购说“料已经下了”&#xff0c;计划说“等物料到位才能排产”&#xff0c;仓库说“根本没看到发货信息”……每天各自忙得团团转&#xff0c;用着各自的Excel表格&#xff0c;开完会都说没问题&#xff0c; 结果月底一核对&#xff0c;…

Java版LeetCode热题100之反转链表:从迭代到递归的全面解析

Java版LeetCode热题100之反转链表&#xff1a;从迭代到递归的全面解析 本文深入剖析 LeetCode 第206题「反转链表」&#xff0c;作为后端开发面试的高频必考题&#xff0c;我们将从基础概念到高级技巧&#xff0c;从代码实现到实际应用&#xff0c;全方位掌握这一经典算法。无论…

大模型知识库(1)什么是Claude Skills?

Claude Skills 是 Anthropic 为其大语言模型 Claude 推出的扩展功能模块&#xff0c;可以理解为 Claude 的 “插件” 或 “技能包”&#xff0c;能够让 Claude 在基础对话能力之上&#xff0c;具备特定场景下的专业能力&#xff0c;从而更好地解决复杂任务。一、 Claude Skills…

Java版LeetCode热题100之回文链表:从数组复制到快慢指针的深度解析

Java版LeetCode热题100之回文链表&#xff1a;从数组复制到快慢指针的深度解析 本文全面剖析 LeetCode 第234题「回文链表」&#xff0c;作为面试高频题&#xff0c;我们将深入探讨三种解法的优劣&#xff0c;重点掌握O(1)空间复杂度的最优解。无论你是算法新手还是经验丰富的开…

Java版LeetCode热题100之相交链表:从哈希到双指针的深度解析

Java版LeetCode热题100之相交链表&#xff1a;从哈希到双指针的深度解析 本文全面剖析 LeetCode 第160题「相交链表」&#xff0c;涵盖题目理解、多种解法实现、复杂度分析、面试技巧及实际应用场景。无论你是准备面试的新手&#xff0c;还是希望深入理解链表操作的老手&#x…

Java版LeetCode热题100之环形链表:从哈希表到Floyd判圈算法的深度解析

Java版LeetCode热题100之环形链表&#xff1a;从哈希表到Floyd判圈算法的深度解析 本文全面剖析 LeetCode 第141题「环形链表」&#xff0c;作为面试必考的经典问题&#xff0c;我们将深入探讨两种核心解法&#xff0c;并重点掌握O(1)空间复杂度的Floyd判圈算法。无论你是算法新…

码字1年,我测废了10个AI写小说软件,最后只推荐这5款小说软件生成器!

哈喽大家好&#xff0c;又是我&#xff01; 我之前分享了&#xff0c;后台收到超多私信&#xff0c;都在说&#xff1a;“博主&#xff0c;道理我都懂&#xff0c;但就是下不了笔&#xff01;” 我太懂了&#xff01;真的&#xff01;&#x1f926; 知道要列大纲&#xff0c;…

富文本控件怎样提升XHEDITOR对Word公式粘贴的兼容性?

企业网站Word粘贴与导入功能解决方案 项目概述与技术需求 作为山西IT行业的.NET工程师&#xff0c;我们近期接到一个企业网站后台管理系统的升级需求&#xff0c;主要目标是实现Word内容一键粘贴和文档导入功能。这个功能将极大提升客户的内容发布效率&#xff0c;特别是对于…

不得了!实力天玑AIGEO优化系统代理大揭秘

实力天玑AIGEO优化系统代理大揭秘在数字化营销不断发展的当下&#xff0c;天玑AIGEO优化系统在本地精准营销领域逐渐崭露头角。下面将深入剖析该系统领域的行业痛点、天玑AI互联网中心的技术方案以及应用效果。行业痛点分析当前天玑AIGEO优化系统领域面临着诸多技术挑战。在数字…

Java版LeetCode热题100之环形链表 II:从哈希表到Floyd判圈算法的深度解析

Java版LeetCode热题100之环形链表 II&#xff1a;从哈希表到Floyd判圈算法的深度解析 本文全面剖析 LeetCode 第142题「环形链表 II」&#xff0c;作为面试高频难题&#xff0c;我们将深入探讨两种核心解法&#xff0c;并重点掌握O(1)空间复杂度的Floyd判圈算法及其数学证明。无…

医院HIS系统怎样实现检验报告公式转XHEDITOR在线编辑?

打造Word内容一键转存的CMS新闻管理系统升级方案 大家好&#xff01;我是山西某校软件工程专业的一名大三学生&#xff0c;最近正在给我的CMS新闻管理系统添加一个酷炫的功能——Word内容一键转存&#xff01;&#x1f389; 需求分析 我需要给后台编辑器增加一个按钮&#x…

国防项目如何实现加密Word文档公式安全导入XHEDITOR?

企业网站Word粘贴与导入功能解决方案 作为山西IT行业的PHP工程师&#xff0c;我最近正在评估如何为企业网站后台管理系统集成Word粘贴和文档导入功能。以下是针对这一需求的详细技术分析方案。 需求分析 客户需要实现两个核心功能&#xff1a; Word粘贴功能&#xff1a;从W…

军工领域,JAVA大文件分块上传的示例代码是什么?

我&#xff0c;一个被大文件上传逼疯的大三狗&#xff0c;想和你唠唠毕业设计的血泪史 最近为了做毕业设计&#xff0c;我把头发薅掉了小半——老师要的是“能打”的文件管理系统&#xff0c;核心需求就一条&#xff1a;10G大文件上传&#xff0c;还要支持文件夹、断点续传、加…

站群系统如何处理PDF公式转存为XHEDITOR网页格式?

企业网站Word粘贴与导入功能解决方案 项目概述与技术需求 作为山西IT行业的.NET工程师&#xff0c;我们近期接到一个企业网站后台管理系统的升级需求&#xff0c;主要目标是实现Word内容一键粘贴和文档导入功能。这个功能将极大提升客户的内容发布效率&#xff0c;特别是对于…

医疗领域,JAVA大文件上传与下载的示例步骤?

今天早上有网友加我微信&#xff0c;也是咨询这块的技术问题&#xff0c;最近不知道啥情况&#xff0c;加我的网友还是挻多的。实际上我的微信很早就在网上公开了&#xff0c;但是还是有很多网友说找不到。 昨天晚上论坛里面有位网友发私信给我&#xff0c;聊了一下这个问题&am…

汽车制造行业,JAVA如何实现设计图纸的大文件上传示例?

作为国内专注于设计制造领域的软件厂商&#xff0c;近期我们正积极投身于大文件上传下载组件的调研工作。在当前业务场景下&#xff0c;我们有着明确且极具挑战性的需求&#xff1a;所选取的组件必须能够支持高达 100G 文件以及文件夹的上传下载功能&#xff0c;同时要全面适配…

5.1 办公自动化革命:让AI处理90%的重复性文档工作

5.1 办公自动化革命:让AI处理90%的重复性文档工作 在现代职场中,文档处理占据了大量工作时间,从日常邮件撰写到复杂报告编制,从合同审查到数据分析,文档工作无处不在。然而,许多文档任务具有高度重复性和规律性,完全可以借助AI技术实现自动化处理。通过合理运用大语言模…