山东网站建设低多边形生成网站

web/2025/10/1 5:13:21/文章来源:
山东网站建设,低多边形生成网站,大概多少钱,摄影设计说明怎么写近期#xff0c;关于 ChatGPT 的访问量有所下降的消息引发激烈讨论#xff0c;不过这并不意味着开发者对于 AIGC 的热情有所减弱#xff0c;例如素有【2023 最潮大语言模型 Web 开发框架】之称的大网红 LangChain 的热度就只增不减。 原因在于 LangChain 作为大模型能力“B2… 近期关于 ChatGPT 的访问量有所下降的消息引发激烈讨论不过这并不意味着开发者对于 AIGC 的热情有所减弱例如素有【2023 最潮大语言模型 Web 开发框架】之称的大网红 LangChain 的热度就只增不减。 原因在于 LangChain 作为大模型能力“B2B2C”的一个重要的中间站能够将大模型和其他项目丝滑连接在一起达到 1 1 大于 3 的效果。 正如大家所知AIGC 时代提高大模型应用性能的一个关键手段就是将大语言模型LLM和外部数据相结合。具体而言就是在 LLM 中接入现成的数据集并要求 AI 应用能够记住用户的对话通过“反思”对话上下文生成“新记忆”。当用户在 AI 应用中进行检索时应用系统会先在接入的现成数据集中提取相关信息然后结合用户查询以及记忆的上下文最终高效准确地返回检索结果LangChain Milvus 就是其中最好的应用。 为了帮开发者深入理解使用 LangChain 和 Milvus 进行语义搜索的原理及实例Zilliz 联动 LangChain 进行了一次干货满满的直播讨论LangChain 联合创始人兼首席执行官 Harrison Chase 对话 Zilliz 软件工程师 Filip Haltmayer 共同探讨如何使用 LangChain 和向量数据库进行语义搜索以及在此过程中可能会遇到的一些典型案例。 01. 什么是检索 检索是指从内存或其他存储设备中获取信息的过程。那么如何利用检索技术、向量数据库如Milvus、AI 代理如LangChain搭建一个接入外部知识库的 LLM 应用 Harrison 表示尽管 LLM 功能强大但在使用上还存在一些限制比如 LLM 只能记住预先训练时的信息。这就意味着LLM 并不能够做到实时更新数据信息。举个例子ChatGPT 的数据仅涵盖 2021 年及以前的数据因此 ChatGPT 无法回答 2021 年之后的信息。除此之外LLM 还缺乏特定领域的专业信息如业务相关的特定数据。在此情况下检索技术能够作为一种补充形式帮助我们打破 LLM 本身的使用限制。换言之检索技术能够为 LLM 应用提供更多信息上下文从而帮助 LLM 返回更准确的答案。 02. 语义搜索——检索技术的主流用例 检索技术的主流用例之一就是语义搜索。Harrison 解释了语义搜索如何在 CVP 架构ChatGPT Vector Database Prompt中发挥作用。 下图展示了语义搜索在 CVP 技术栈中的作用。如果用户提出了一个一般问题且 LLM 可以回答那么 LLM 会直接返回问题的答案。但是如果用户提出的问题是特定领域的专业问题那么这个问题会被转化为向量并被发送到如 Milvus 之类的向量数据库。而向量数据库中已经预先存储了一些专业文档片段的 embedding 向量。当用户专业问题向量被发送到向量数据库后会在数据库中进行相似性搜索以找到 “top-k” 个最相关的结果。这些找到的结果会与用户查询的问题一同经过 AI 代理 如LangChain的处理合并发送到 LLM。最终 LLM 返回令人满意的响应结果。 CVP 技术栈中的语义搜索 03. 语义搜索的典型案例 语义搜索十分常用且能够有效解决多种 LLM 应用的问题。Harrison 列举了 5 个语义搜索的典型案例并详细分析了每种情况 重复信息 如果数据库中存有许多重复文档检索信息会面临一些挑战。这些重复的内容其实不适用于 LLM会产生很多不必要的上下文。 对于这个问题 Harrison 提出了以下 3 种解决方案 通过语义搜索过滤掉类似的文档。例如在将提示发送到 ChatGPT 之前LangChain 会检索 20-30 个相似文档并通过向量检索技术过滤掉或者绕过重复文本再将提示发送到 ChatGPT。利用最大边际相关算法来优化多样性。此搜索侧重于从其他检索到的向量中获取相似和多样的结果。在存储之前对文档进行去重。但是这种方法挑战性最大因为需要大量时间和精力来确定一个相似性分数用于判定文档是否重复。即便设置了一个相似性分数它也未必十分准确因为单个事物的单个向量维度差异巨大分数稍有偏差结果就会大相径庭。 冲突信息 如果对于同一个问题不同来源的数据给出不同的回答则会导致信息冲突。如果将这些数据据全部都给到 LLM可能会导致 LLM 混乱。 例如用户想要通过 LLM 应用查询公司休假政策而人力资源文件和一些临时会议记录给出了不同的答案。 对于这种情况Harrison 提出了以下 2 种解决方案 对来源进行优先级排序并将优先级打分权重加入到检索中。将所有源信息都传入生成步骤交由 LLM 来判断哪个信息源更可靠。 时效性 信息需要不断更新保证信息的时效性。例如公司的休假政策可能会偶尔更新那 LLM 应用需要能够确保给到用户更新后的正确信息。 对于这种情况Harrison 提出了以下 3 种解决方案 在检索中进行对最近的信息进行加权——完全过滤过时的信息。给生成信息带上时间戳——要求 LLM 优先选择更近期的信息。不断反思即不断修订 LLM 对一个话题的理解。 元数据查询 某些情况下用户提出的问题更侧重于元数据信息而非内容本身。 例如用户可能会查询“1980年间关于外星人的电影”。其中“关于外星人的电影”这一部分可以进行语义搜索而”1980 年间“其实是需要通过精确匹配来筛选结果的。 对于这种情况Harrison 建议在执行语义搜索检索之前先加入一个元数据过滤器。这样一来当用户查询”1980年间关于外星人的电影“时其实会分为两个步骤 元数据过滤器通过精确匹配先筛选出年份为 1980 年的电影。语义搜索查询筛选结果中”关于外星人“的电影。 许多向量存储器都允许在查询前先通过元数据过滤器筛选数据。如果大家选择的向量存储器不支持在查询前进行元数据过滤那么在语义搜索之后再过滤数据也是一个可行的方案。 多跳问题 用户可能会一次提出多个问题这会给语义搜索带来挑战。对于这种情况Harrison 建议使用如 LangChain 之类的 AI 代理工具。LangChain 可以将问题分解为几个步骤并使用语言模型作为推理引擎来检索所需信息。但是这种方法的一个弊端就是多次调用 LLM导致使用成本较为高昂。 对此Filip 建议集成 GPTCache 与 LangChain使用 GPTCache 存储 LLM 生成的问题和答案。在用户下一次提出类似查询时GPTCache 会先在缓存中搜索是否是已经问过的重复问题之后如有必要再执行语义搜索并调用 LLM。这样一来可以大大节省 LLM 的调用成本。 04. 问答彩蛋 问题 1: 如何使用外部知识生成 Prompt 是否能够提供一些示例或者小技巧LangChain 后续是否计划添加一些功能能够帮助优化 Prompt Harrison Chase想要写出好的 Prompt关键就在于要先明确自己想要什么。如果你无法清楚表达自己的意图那么 LLM 是不知道该怎么做的这就和人类之间的交流一样。而且我们确实后续会添加一些功能帮助用户优化 Prompt。 问题 2: 如何看待当前基于检索增强的文本生成赛道现在我们也看到了许多解决方案如 Langchain、LlamaIndex、Vectara 等。是否有用于细化检索步骤包括路由器查询引擎等的最佳解决方案您之前提到检索技术可以区分文件的重要性LangChain 是否已经实现此类功能 Harrison Chase整个赛道仍处于早期阶段发展非常迅速。我们首先要区分检索步骤和生成步骤。对于检索而言我认为 LangChain 模块化的架构支持自定义向量检索系统更具灵活性。Vectara 是一套出色的端到端全托管的检索解决方案。LlamaIndex 提供了一些更有趣的数据结构如树型结构可供实验使用。对于生成步骤而言所有用例都使用的是 LangChain。我们和这 3 种方案都有集成。 问题 3: 随着时间推移LLM 可能会不断放宽其对提示中上下文字数限制这对检索技术用例有何影响 Harrison Chase虽然 Anthropic 推出了支持 10 万上下文长度的 LLM 上下文转换器插件但我们为什么仍然需要向量数据库向量数据库提供了一种更高效的解决方案。设想一下如果 LLM 负责所有计算的工作而向量数据库负责所有存储的工作那计算开销会飞速上涨。这也就是说处理的上下文越多成本越高。这时我们就可以使用向量数据库来节省开销。计算总是比存储更贵而且甚至昂贵 100 多倍。而且使用上下文转换器LLM 仍有可能会忘记早期对话中的内容。 问题 4: Cohere 发布了维基百科的向量数据集另外还有一个项目发布了 arXiv 摘要的向量数据集。您此有什么看法吗你是否有推荐的用于开源向量内容的最佳模型 Harrison Chase首先这些初衷都是好的可以帮忙熟悉语义搜索并降低生成向量数据所需的额外时间和成本。但是预先计算也会带来一些限制例如你不可以修改 Embedding 方式或内容。此外其实对于您的数据并不存在最佳的推荐模型。我只能说您使用的模型越流行的话您的数据集被使用的概率就会越大。 问题 5: LangChain 中内存分包的工作原理是什么样的为什么聊天消息的历史记录与内存分开这样设计是否有什么特别理由 Harrison Chase我们正在重新设计内存模块使其更加清晰。 点击【阅读原文】或访问下列网址观看直播回放 https://zilliz.com/event/memory-for-llm-applications-webinar 「寻找 AIGC 时代的 CVP 实践之星」 专题活动即将启动 Zilliz 将联合国内头部大模型厂商一同甄选应用场景 由双方提供向量数据库与大模型顶级技术专家为用户赋能一同打磨应用提升落地效果赋能业务本身。 如果你的应用也适合 CVP 框架且正为应用落地和实际效果发愁可直接申请参与活动获得最专业的帮助和指导联系邮箱为 businesszilliz.com。 推荐阅读

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/84863.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

淮安建立公司网站流程建设网站的推广的软文

在 Linux C 语言环境下进行 UDP 通信时,您会使用多个标准的系统调用和函数来创建和管理 UDP 套接字。以下是一些在 UDP 通讯中常用的函数: **socket()**: 创建套接字。对于 UDP 通信,第二个参数选择 SOCK_DGRAM。 int sockfd so…

云南微网站搭建软件项目流程八个阶段

房价是一个城市发展程度的重要体现,一个城市的房价越高通常代表这个城市越发达,对于人口的吸引力越大!因此,房价数据是我们在各项城市研究中都非常常用的数据!之前我们分享了2019—2023年我国地级市逐月的新房房价数据…

河北建设厅网站上不去wordpress登陆可见插件

1、安装驱动 使用 npm 进行安装 mysql $ npm install mysql 2、连接数据库 在以下实例中根据你的实际配置修改数据库用户名、及密码及数据库名: test.js 文件 var mysql require(mysql); var connection mysql.createConnection({host : localhost…

天津网站建设是什么空间商网站

Module语法 CommonJS模块 let { readfile } require(fs) # 等同于 let _fs require(fs) let readfile _fs.readfile //这种加载称为“运行时加载”ES6模块 import { stat, exists, readFile } from fs;这种加载称为“编译时加载”或者静态加载 静态加载带来的各种好处 …

东莞营销网站建设东莞网站设计实力

一、为什么选择网络安全? 这几年随着我国《国家网络空间安全战略》《网络安全法》《网络安全等级保护2.0》等一系列政策/法规/标准的持续落地,网络安全行业地位、薪资随之水涨船高。 未来3-5年,是安全行业的黄金发展期,提前踏入行…

安装网站模版视频教程网站建设案例实录

vue3获取当前路由为什么一直是 / ? 今天在写项目的时候,我想获取到当前的路由去做路由的匹配,我靠,不知道抽什么风一直获取的路由是 / 最搞笑的是gpt都不明白问题出在哪里 ,经过一顿百度,最终发现问题如下&#xff…

天津网站seo营销模板下载百度导航最新版本

这几道题目还是有一点意思的,大家可以研究一番,对自己的技能提升绝对有帮助。 1、调用过程中输出的内容是什么 function fun(n, o) {console.log(o);return {fun : function(m) {return fun(m, n);}} }var a fun(0);a.fun(1);a.fun(2);a.fun(3);var…

河南省工程建设协会网站青建设厅官方网站海省

摘要:我们每个人都是工具的奴隶。随着我们的学习,我们不断的加深自己对工具的认识,从而从它们里面解脱出来。现在我就来说一下我作为各种工具的奴隶,以及逐渐摆脱它们的思想控制的历史吧。 当我高中毕业进入大学计算机系的时候&am…

浦口区网站建站公司win7不能运行wordpress

原文链接:https://my.oschina.net/u/3474266/blog/895696 我在安装免安装版的5.7.18的时候出现了问题,正好找到这个,十分感激 今天下载安装了MySQL Community Edition 5.7.18压缩版,过程中遇到了一些坑,特地写个博客记…

江苏华江建设集团网站网站建设 的公

Java 9集合工厂方法:用List.of、Set.of、Map.of创建安全不可变集合 Java 9引入了革命性的集合工厂方法List.of、Set.of和Map.of,彻底改变了开发者创建小型不可变集合的方式。这些方法不仅语法简洁,还在安全性和性能上实现了质的飞跃。本文将…

乒乓球网站建设目标中信建设有限责任公司待遇怎么样

前言:前面写过一篇PytestAllure接口自动化测试框架搭建的博客,这篇博客学习另外一款优秀的开源的接口自动化测试框架:HttpRunner,本博客主要学习如何搭建基于HttpRunner的接口自动化测试项目 PytestAllure接口自动化测试框架搭建…

医院招聘网站建设和维护人员seo常用方法

说明过程 C语言程序可以通过分文件编写来提高代码的结构性和可维护性。下面是一个简单的示例,展示了C语言程序如何分文件编写: 创建多个源文件:将程序的不同部分分别写在不同的源文件中,每个文件包含一个或多个相关的函数。比如&…

下载的网站模板怎么进入后台php做电影网站有哪些

0x01 Linux 分区简介主分区 vs 扩展分区硬盘分区表中最多能存储四个分区,但我们实际使用时一般只分为两个分区,一个是主分区(Primary Partion)一个是扩展分区(extended partition),主分区可以马上被使用但不能再分区,扩展分区必须…

网站建设与管理 ppt好的网站建设公司哪家好

linux最优秀的地方之一,就在于他的多用用户、多任务环境。 用户及用户组的概念 1、文件所有者 由于linux是一个多用户、多任务的系统。因此可能常常会有很多人同时使用这台主机来进行工作的情况发生,为了考虑每个人的隐私权以及每个人的喜好的工作环境&a…

宁都县建设局网站wordpress收费主题免费下载

1. 简介 模板方法模式是一种行为型设计模式,它定义了一个算法的骨架,将一些步骤延迟到子类中实现。这样,可以在不改变算法结构的情况下,重新定义算法中的某些步骤。 2. 使用条件 模板方法模式适用于以下情况: 算法…

工程建设监理网站百度指数首页

在本文中,我们将深入研究ClickHouse索引。我们将对此进行详细说明和讨论: ClickHouse的索引与传统的关系数据库有何不同ClickHouse是怎样构建和使用主键稀疏索引的ClickHouse索引的最佳实践 您可以选择在自己的机器上执行本文给出的所有Clickhouse SQL…

柳州网络网站建设上海高档网站建设

在Kerberos阶段认证的AS-REQ阶段,请求包cname对应的值是用户名,当用户名存在时候,密码正确和错误两种情况下,AS-REP返回包不一样,所以可以利用这一点对域用户名进行密码喷洒攻击 域内密码喷洒工具 Kerbrute kerbrut…

网站后期的维护设计与制作网站

大家好,我是海鸽。 今天,我要和大家分享如何将请求 GPT 的案例,快速“复刻”成 GPT 网页版。这不仅简单,而且对于我们这些后端开发者来说,简直是福音! 先睹为快 看看这个界面,是不是感觉很熟…

做暖暖免费视频网站哪些人做数据监测网站

目录 事务基本概念 前置准备 Spring Boot 事务使用 编程式事务 声明式事务 Transactional 注解参数说明 Transational 对异常的处理 解决方案一 解决方案二 Transactional 的工作原理 面试题 Spring Boot 事务失效的场景有那些? 事务基本概念 事务指一…

动漫男的和女的做视频网站广州怎么做网站

原文:The ChatGPT GoldRush 译者:飞龙 协议:CC BY-NC-SA 4.0 一、ChatGPT 简介 什么是 ChatGPT? ChatGPT 是由 OpenAI 基于 GPT-4 架构创建的大型语言模型。它旨在理解和回应自然语言文本输入,使得可以与机器进行对话…