yyds!大模型当SQL副驾驶,小白也能秒变数据大神,效率翻倍不是梦

SQL 是数据世界的语言;然而,任何花时间编写查询的人都知道其中的痛苦。记住窗口函数、多表连接的确切语法,以及调试隐晦的SQL 错误可能既繁琐又耗时。对于非技术用户来说,获取简单的答案往往需要求助于数据分析师。

大型语言模型(LLMs)正在开始改变这种局面。LLMs 可以充当副驾驶,将人类指令转化为 SQL 查询,向人类解释复杂的 SQL 查询,并提出优化建议以加快计算速度。结果是显而易见的:更快的迭代降低非技术用户的门槛,以及减少浪费在查找语法上的时间

为什么 LLM 适用于 SQL

LLMs 擅长将自然语言映射到结构化文本。而SQL本质上就是具有明确模式的结构化文本。向 LLM 提问:“找出上个季度销量前 5 的产品”,它就可以起草一个使用GROUP BY(用于不同渠道)、ORDER BYLIMIT(用于获取前 5 名)子句的查询。

除了起草查询之外,LLMs 还可以充当有用的调试伙伴。如果查询失败,它可以总结错误,指出您输入的 SQL 中的错误,并推荐不同的修复方案。它们还可以建议更高效的替代方案,以减少计算时间并提高效率。它们甚至可以将 SQL 问题翻译成纯英语,以便更好地理解。

使用场景

最明显的用例是自然语言到 SQL,它允许任何人表达业务需求并接收查询草稿。但还有很多其他用途。分析师可以粘贴错误代码,LLM 可以帮助调试错误。这位分析师可以分享用于准确调试错误的正确提示,并与同事分享,以节省时间。新手可以依靠副驾驶将SQL 翻译成自然语言。有了正确的模式上下文,LLMs 可以生成针对组织实际数据库结构定制的查询,这使得它们比通用语法生成器强大得多。

尽管 LLMs 潜力巨大,但它们也有一些已知的限制。最突出的是列幻觉(column hallucination)以及在未提供上下文时生成随机的表名。如果没有正确的模式上下文,LLM 很可能会诉诸于假设并出错。LLMs 生成的查询可能可以执行,但它们可能效率低下,导致成本增加和执行时间变慢。除了所有这些问题之外,还有一个明显的安全风险,因为敏感的内部模式可能会与外部 API 共享。

结论非常简单:LLMs 应该被视为副驾驶,而不是完全依赖它们。它们可以帮助起草和加速工作,但在执行之前,需要人工干预进行验证

通过提示工程改进 LLM 结果

提示工程是学习有效使用 LLMs 最关键的技能之一。对于 SQL 副驾驶来说,提示是一个关键杠杆,因为模糊的提示往往会导致不完整、错误,有时甚至是毫无意义的查询。通过提供正确的模式上下文、表列信息和描述,输出查询的质量可以显着提高

除了数据模式信息,SQL 方言也很重要。所有 SQL 方言,如 Postgres、BigQuery 和 Presto,都有细微的差异,向 LLM 提及 SQL 方言将有助于避免语法不匹配。对输出的细节描述也很重要,例如:指定日期范围、前 N 个用户等,以避免不正确的结果和不必要的数据扫描(这可能导致昂贵的查询)。

根据我的经验,对于复杂的查询,迭代提示(iterative prompting)效果最好。先要求 LLM 构建一个简单的查询结构,然后逐步细化效果最佳。您也可以使用 LLM 在提供最终 SQL 之前解释其逻辑。这对于调试和指导 LLM 关注正确的方面非常有用。您可以使用少样本提示(Few-shot prompting),即在要求 LLM 生成新查询之前向其展示一个示例查询,以便它有更多的上下文。最后,错误驱动提示(error-driven prompting)有助于最终用户调试错误消息并获得修复。正是这些提示策略区分了“几乎正确”的查询和实际可运行的查询。

您可以从下面的示例中看到这一点,其中一个模糊的提示导致了列名幻觉。相比之下,一个经过精心设计、更详细的提示,您会得到一个定义良好、匹配所需 SQL 方言且没有幻觉的查询。

最佳实践

在使用 SQL 副驾驶时,可以遵循一些最佳实践。始终建议在运行查询之前进行人工审查,尤其是在生产环境中。您应该将 LLM 输出视为草稿而不是最终输出。其次,集成是关键,因为一个与组织现有 IDE、Notebooks 等集成在一起的副驾驶将使其更具可用性和效率。

安全与风险

SQL 副驾驶可以带来巨大的生产力提升,但在组织范围内推广它们之前,我们应该考虑一些风险。首先是过度依赖的担忧;副驾驶可能导致数据分析师严重依赖它,而从不构建核心 SQL 知识。这可能导致潜在的技能差距,即团队可以创建 SQL 提示,但无法排除故障。

另一个担忧是数据治理。我们需要确保副驾驶在没有正确权限的情况下不会与用户共享敏感数据,从而防止提示注入攻击。组织需要建立正确的数据治理层,以防止信息泄露。最后,还有成本影响,频繁调用副驾驶 API 可能导致成本快速累积。如果没有正确的用量和令牌策略,这可能会导致预算问题。

评估指标

在投资 LLMs 用于 SQL 副驾驶时,一个重要的问题是:你如何知道它们正在发挥作用?你可以从多个维度来衡量副驾驶的有效性,例如正确性、人工干预率、节省的时间和重复支持请求的减少

正确性是一个重要的指标,用于确定在 SQL 副驾驶提供了一个没有错误运行的查询时,它是否产生了预期的正确结果。这可以通过抽取提供给副驾驶的输入样本,并让分析师起草相同的查询来比较输出来实现。这不仅有助于验证副驾驶的结果,还可以用于改进提示以提高准确性。除此之外,这个练习还会为您提供每次查询节省的估计时间,有助于量化生产力提升。

另一个简单的衡量指标是无需人工编辑即可运行的生成查询的百分比。如果副驾驶持续生成可工作的可运行查询,它们显然在节省时间。一个不那么明显但强大的衡量标准是非技术人员重复支持请求的减少。如果业务团队能够使用副驾驶更多地自助解决他们的问题,数据团队就可以花更少的时间回答基本的 SQL 请求,将更多时间专注于高质量的洞察和战略方向。

展望未来

想象一下副驾驶可以帮助您完成整个端到端流程具备模式感知能力的 SQL 生成集成到数据目录中,能够生成仪表板或可视化。除此之外,副驾驶可以从您的团队过去的查询中学习,以调整其风格和业务逻辑。SQL 的未来不是取代它,而是消除摩擦以提高效率

SQL 仍然是数据堆栈的支柱;LLMs 作为副驾驶工作时,将使其更具可访问性和生产力。提问与获得答案之间的差距将大大缩小。这将解放分析师,让他们花更少的时间整理和谷歌搜索语法,将更多的时间用于开发洞察。只要运用得当,加上仔细的提示和人工监督,LLMs 有望成为数据专业人员工具包的标准配置。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1149549.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RaNER模型实战应用|AI智能实体侦测服务助力信息抽取

RaNER模型实战应用|AI智能实体侦测服务助力信息抽取 人工智能将和电力一样具有颠覆性 。 --吴恩达 如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能(AI)正赋能各个产业,推动着人类进入智能…

一键解析PDF结构与内容|基于科哥开发的PDF-Extract-Kit镜像

一键解析PDF结构与内容|基于科哥开发的PDF-Extract-Kit镜像 1. 引言:PDF智能提取的工程化实践需求 在科研、教育和企业文档处理场景中,PDF作为标准文档格式承载了大量非结构化信息。传统PDF处理工具往往局限于文本提取或简单OCR&#xff0c…

边缘设备也能跑翻译大模型?HY-MT1.5-1.8B轻量化部署指南

边缘设备也能跑翻译大模型?HY-MT1.5-1.8B轻量化部署指南 随着多语言交流需求的爆发式增长,传统云端翻译服务在隐私保护、延迟响应和离线可用性方面逐渐暴露出局限。尤其在跨境会议、智能穿戴设备、工业巡检等场景中,对低延迟、高安全、可离线…

边缘设备也能跑翻译大模型?HY-MT1.5量化部署指南

边缘设备也能跑翻译大模型?HY-MT1.5量化部署指南 随着多语言交流需求的爆发式增长,高质量、低延迟的实时翻译能力正成为智能硬件和边缘计算场景的核心刚需。然而,传统大模型往往依赖高性能GPU集群,难以在资源受限的终端设备上运行…

Fluke8508A福禄克8588A 8558A八位半万用表

福禄克8508A是一款八位半高精度标准数字多用表,专为计量校准和精密测量应用设计。‌ 1 它具备卓越的准确度和稳定性,年稳定度可达2.7 ppm,24小时稳定度为0.5 ppm,确保测量结果在长时间内保持一致。‌ 1 主要功能与特点 ‌高分辨率…

WordPress网站模板设计完整指南

为什么WordPress是网站模板设计的最佳系统选择在当今数字化时代,选择合适的内容管理系统对于网站建设至关重要。经过多年的实践经验,WordPress无疑是网站模板设计领域中最优秀的系统之一。作为全球超过43%网站的驱动力量,WordPress凭借其灵活性、可扩展性和用户友好性,成为了从…

教育行业用AI机器人外呼成功案例分享

在教育行业数字化转型浪潮中,人工外呼的低效困境愈发凸显——日均外呼不足300通、有效转化率低于5%、人力成本占比高达28%,成为机构运营的沉重负担。教育行业目前主流拓客渠道还是以电销为基础联系客户,从而快速建立联系。那么在这个环节上&a…

如何寻找具备 Drummond Group AS2 国际认证的EDI 产品?

在数字化供应链重构的浪潮中,电子数据交换(EDI)已从“可选配置”升级为企业对接全球贸易伙伴的“必备能力”。作为 EDI 数据传输的主流协议——AS2 协议凭借安全加密、可靠传输的特性,成为企业间数据交换的核心选择,选…

【爆肝实测】程序员私藏神器!AnythingLLM本地部署大模型,再也不怕数据泄露了!AI开发小白也能秒变大神!

像 NotebookLM 和 ChatPDF 这样的几款基于 RAG(检索增强生成)的工具可以帮助从数据中提取洞察。然而,它们对基于网络的依赖引发了重大的隐私问题,尤其是在处理机密的公司信息时。因此,组织和个人需要这样的平台&#x…

单目视觉的深度秘密:MiDaS模型技术剖析

单目视觉的深度秘密:MiDaS模型技术剖析 1. 引言:从2D图像到3D空间感知的技术跃迁 在计算机视觉领域,如何仅凭一张普通照片还原出真实世界的三维结构,一直是极具挑战性的课题。传统方法依赖双目立体匹配或多视角几何,…

运营商中立托管的实用优势探析

运营商中立托管允许您在共享设施中托管基础设施,而无需绑定到单一连接选项。大楼内已有多个网络运营商。您可以在它们之间进行选择,同时与多家合作,或根据需求变化更换提供商,而无需物理移动您的系统。这与非中立环境形成鲜明对比…

[Dubbo]-快速入门

Dubbo概念 Dubbo概念 Dubbo是阿里巴巴公司开源的一个高性能、轻量级的Java RPC框架致力于提供高性能和透明化的 RPC远程服务调用方案,以及SOA服务治理方案官网:http://dubbo.apache.org Dubbo架构 过程说明: 服务启动后, 服务就会注册到注册中心 (start -> re…

小参数高精度翻译新标杆|HY-MT1.5-1.8B模型镜像应用揭秘

小参数高精度翻译新标杆|HY-MT1.5-1.8B模型镜像应用揭秘 在多语言交流日益频繁的今天,实时、精准且可私有化部署的翻译能力已成为企业全球化服务的关键支撑。腾讯混元团队推出的 HY-MT1.5-1.8B 翻译模型,以仅18亿参数实现了接近70亿大模型的…

【震惊】7款GitHub爆火RAG框架大比拼,小白程序员也能秒变AI大神!手把手教你玩转大模型开发!

在过去几年中,检索增强生成 (RAG) 的生态系统已经蓬勃发展。互联网上出现了越来越多旨在帮助开发者构建 RAG 应用的开源项目。这也是情理之中的事,因为 RAG 是一种用外部知识源来增强大型语言模型 (LLMs) 的有效方法。 RAG****管道 (pipelines) 的运作方…

AI分类器在电商的应用:云端GPU实战,3步实现自动打标

AI分类器在电商的应用:云端GPU实战,3步实现自动打标 引言:为什么电商需要AI自动打标? 作为淘宝店主,你是否每天花费数小时手动给商品分类打标?服装要分男女款、季节、风格;电子产品要分品牌、…

AI万能分类器极限测试:100万数据5小时处理完

AI万能分类器极限测试:100万数据5小时处理完 引言 当你的团队需要处理海量文本分类任务时,是否遇到过这样的困境:本地机器跑不动,临时采购硬件又太慢,云服务配置起来太复杂?今天我要分享的正是解决这些痛…

AI万能分类器行业方案:零售/医疗/金融场景定制

AI万能分类器行业方案:零售/医疗/金融场景定制 引言 想象一下,你是一家连锁超市的运营总监,每天需要处理数百万条商品评论;或者是一家医院的IT负责人,需要快速分类海量医疗影像;又或者是银行的风控专员&a…

支持人名地名机构名识别|RaNER模型镜像一键部署

支持人名地名机构名识别|RaNER模型镜像一键部署 1. 背景与需求:中文命名实体识别的现实挑战 在当今信息爆炸的时代,非结构化文本数据(如新闻报道、社交媒体内容、政府公文、企业文档)占据了数据总量的80%以上。如何从…

Open WebUI出现高危漏洞,免费模型或成企业后门

安全研究人员发现Open WebUI存在一个高危漏洞,该平台是一个自托管的大语言模型企业界面。这个漏洞编号为CVE-2025-64496,允许通过直连功能连接的外部模型服务器注入恶意代码并劫持AI工作负载。漏洞产生的原因该漏洞源于对服务器发送事件(SSE&…

腾讯混元翻译模型HY-MT1.5镜像快速上手指南

腾讯混元翻译模型HY-MT1.5镜像快速上手指南 1. 引言:为什么选择HY-MT1.5翻译模型? 随着全球化进程加速,高质量、低延迟的机器翻译需求日益增长。传统云翻译服务虽性能强大,但存在隐私泄露、网络依赖和响应延迟等问题&#xff0c…