一般做网站宽度是多少深圳的设计网站

news/2025/10/1 10:48:22/文章来源:
一般做网站宽度是多少,深圳的设计网站,网站80端口备案,网络网站建设电话推销LLM-based KG KnowLM OpenSPGKG-based RAG 基本原理 从query出发的语义解析 pre-LLM方法 思想#xff1a;直接将问题解析为对应的逻辑表达式#xff0c;然后到知识图谱中查询。 方法#xff1a;通常包含逻辑表达式、语义解析算法、语义解析模型训练三部分。一般步骤是将问句…LLM-based KG KnowLM OpenSPGKG-based RAG 基本原理 从query出发的语义解析 pre-LLM方法 思想直接将问题解析为对应的逻辑表达式然后到知识图谱中查询。 方法通常包含逻辑表达式、语义解析算法、语义解析模型训练三部分。一般步骤是将问句解析成中间表示再将中间表示向知识库映射获得最终的逻辑表示。 逻辑表达式lambda-calculus支持实体数词函数等常量支持多种逻辑连接词支持\exists,\forall等存在量词argmax,argmin等额外量词,lambda-DCS组合语法更简单支持最基本的实体、关系、Join/intersection操作支持Bridging操作可以把两个独立的语义片段组合起来将离散语义组合为更完整的语义, 组合范畴语法CCG由解析规则、解析算法、解析模型训练组成解析规则由词汇、句法类型、语义类型构成CCG支持应用、组合、类型转化、并列等操作。 语义解析的基本步骤短语检测识别短语的实体和关系包括分词、词性标注POS、命名实体识别NER依赖关系分析构造短语依存图等步骤资源映射grouding包括实体链接、概念匹配、关系分类/关系抽取目标是将问句与知识图谱上的本体匹配可以从短语依存图出发实现语义组合包括句法分析组合模型训练语义组合等步骤逻辑表达生成。 语义解析器的训练目标是通过大规模知识库上的问题/答案对集合训练Parser用在语义组合阶段。以词法、语法、对齐、桥接、实体链接、关系识别为特征以候选逻辑表达式为目标 难点1. 语义解析的Bridging操作通常谓词不是明确表示的,导致问句中的谓词无法与知识图谱中的关系直接映射将实体周边的谓词与问句中真正的谓词对应即Bridging。2. 知识图谱是高度不完备的因此需要进行问句的短语重写来匹配知识Prapharasing因此需要搜集高质量的语料来训练短语重写模型。 缺点最大缺点是对知识图谱中资源的利用程度不够,知识图谱中的海量知识是可以极大的增强问句的理解过程的,更好的方法应该充分深挖问句和知识图谱两方面资源所包含的信息。 LLM-based方法 增加一路与向量库平行的KG上下文增强策略基于模型的NL2X能力或单独的NL2X模块将query解析为图查询语言直接执行图查询然后后查询的结果转换为文本片段。 从图谱出发的检索排序 pre-LLM方法 主要思路根据query抽取实体然后把实体作为种子节点对图进行采样必要时可把KG中节点和query中实体先向量化通过向量相似度设置种子节点然后把获取的子图转换成文本片段针对query进行排序。 关键模块排序模型 基于特征的检索排序模型针对每个答案构造特征常用的问题特征包括疑问词特征、问题实体特征、问题类型特征、问题动词特征、问题上下文特征。常用的答案特征包括谓词特征、类型特征、上下文特征。 基于子图匹配的检索排序模型从输入问题中定位问题实体,随后答案候选检索模块以该问题实体为起点按照特定规则从知识图谱中选择答案候选,接下来,答案子图生成模块为每个答案候选实体从知识图谱中抽取出一个子图,作为该答案实体的一种表示。最后答案检索排序模块计算输入问题和每个答案子图之间的相似度用来对子图对应的答案候选进行打分,从而排序得到最终答案Wen-tau Yih, Ming-Wei Chang, Xiaodong He, Jianfeng Gao. Semantic Parsing via StagedQuery Graph Generation: Question Answering with Knowledge Base, ACL, 2015。 基于向量表示的检索排序为输入问题Q 和答案候选 A 分别学习两个稠密的向量表示f(Q)和g(A):并在向量空间中计算问题向量和答案向量之间的相似度用于对不同的答案候选进行打分。 基于记忆网络的检索排序除问答模块之外,引入记忆网络模块记忆网络模块负责将有限的记忆单元表示为向量问答模块从记忆网络模块中寻找与问题有关的答案如Key-value Memory Network将外部数据输入表示为记忆单元通过问句与记忆单元之间的计算来寻找答案。 主要难点实体链接 难点1实体链接在文本中对知识图谱中的命名实体进行识别和消歧的任务。标准方法使用实体对齐工具如TagMe来检测输入文本中提到的知识图谱实体并将它们链接到正确的知识图谱条目。但也可以将实体链接问题的两部分——识别和消歧——作为一个联合任务,使用端到端的神经网络进行优化 难点2多语言实体链接在实际应用中,我们经常需要把多语言的文本中的实体链接到一个或多个不同语种的知识图谱上这类型的设定被称为是跨语言实体链接当语种数目足够多时,会出现低资源语种或实体对应的训练数据极少的情况因此,需要格外关注零样本和少样本的情形。《Entity Linking in 100 Languages》 LLM-based方法 基本方法基于LLM进行中心实体抽取然后从中心实体出发获取知识图谱中有关的实体的子图转换为自然语言作为候选答案然后对候选答案进行向量化根据与query的语义相似度进行排序选出得分最高的候选答案作为上下文输入LLM进行编排得到最终回答。 实体链接实现KG-RAG实体识别使用LLM实现预先将KG中的节点使用特定的embedding模型进行向量化查询时计算抽取实体与KG节点的相似度选择topk相似节点作为候选实体。问题1理论层面没有消歧不能解决实体异名、同名异意的问题2. 实现层面需要预先向量化指定向量集合和KG数据库。 KAPING直接以KG中抽取的三元组作为提示 从知识图谱中抽取相关的事实三元组并将其作为提示信息输入到大模型。因此在这一方法中如何抽取最相关的三元组是需要解决的主要问题。所提方法分为三个模块知识获取-知识表达-知识注入。知识获取的目标从给定问题中抽取相关的实体。本模块采用的方法为传统的实体链接方法。然而该实体相关三元组可能规模较大且并非所有都与问题相关。基于这一考虑本文首先采用已有的句子表示模型分别将三元组和问题映射到统一表示空间选择前K个与问题语义最相似的三元组。知识表达的目标是将三元组转化为文本形式的表示。知识注入的目标是根据三元组和给定问题构建大模型提示词。构建方法为首先列出N个相关三元组然后增加说明信息“Below are facts in the form of the triple meaningful to answer the question”。 Think on Graph从KG中搜索下一步推理路径 从给定问题出发每一步推理都要经过扩展-推理的过程每步推理都是基于问题通过大模型在知识图谱数据中搜索下一步推理的相关路径。主要步骤为首先识别输入问题中的主题实体然后利用大模型对外部知识图谱进行探索和推理检索相关的路径。如此循环直到达到最大步数或得到推理答案。 开源项目 https://github.com/BaranziniLab/KG_RAG https://github.com/stanford-oval/WikiChat 1. 基于LLM生成从wiki百科检索的查询发送到信息检索系统从语料库中获取相关段落并根据时间信息对结果进行重新排序以获取近义词段落。再看有趣的大模型RAG问答优化策略:Wikichat七步走及KG-RAG实现范式 (qq.com) 文本索引使用WikiExtractor工具(https://github.com/attardi/wikiextractor) 从2023年4月28日获得的英文维基百科转储中提取纯文本与ColBERT一样将每篇文章忽略表格和信息框划分为不同的文本块作为段落并在段落前加上文章标题将段落和标题的总长度限制在120字以内。 检索召回在维基百科上使用ColBERTv2(https://github.com/stanford-futuredata/ColBERT/) 和PLAID(https://arxiv.org/abs/2205.09707) 作为检索工具。ColBERT是一种快速准确的检索模型可在数十毫秒内对大型文本集合进行基于BERT的可扩展搜索ColBERT的后期交互可有效地对查询和段落之间的细粒度相似性进行评分。ColBERT是表示-交互检索模型的代表由一个线上encoder一个线下encoder组成encoder具体采用的是bert而且是共享权重的。此外encoder的输出会进入一个没有激活函数的线性层用于缩小每个token的维度起到加速的作用。 而且还会将document的encoder输出结果中的标点符号去掉也是起到加速作用。 2. 汇总和过滤检索到的段落基于LLM从检索到的段落中提取相关部分并将其归纳为要点 3. 生成初始回复提示LLM生成对对话历史的回复这种回复通常包含有趣和有用的知识但本质上并不可靠 4. 从回复中提取声明LLM回复被分解为多个声明(claim)。这一阶段解决共同参照问题以减少歧义并解决了当前和去年等相对时间信息 5. 使用检索到的证据对回复中的声明进行事实检查使用思维链提示只有得到证据支持的声明才会被保留 6. 起草最终回复根据给定的要点清单和对话历史记录生成回复草稿 7. 完善最终回复根据相关性、自然性、非重复性和时间正确性生成反馈并完善回复KG-enhanced LLM 知识注入训练的LLM ERNIE KnowBert LUKE KBERT 基于知识图谱微调的LLM KoPA介绍 KoPA是一个两阶段的基于LLM的KGC框架。首先对给定的KG中的实体和关系进行结构嵌入预训练上面的支路,然后然后通过结构前缀适配器将这些信息注入输入序列用于采用指令调优来微调LLM。结构嵌入预训练KoPA从KG中提取实体和关系的结构信息并将其适应到LLM的文本表示空间中。使用负采样的自监督预训练目标定义得分函数 ( F(h,r,t) ) 来衡量三元组的合理性。通过最小化这种预训练损失实体和关系的结构嵌入被优化以适应所有相关的三元组。知识前缀适配器在完成结构嵌入预训练后通过知识前缀适配器将结构嵌入转换为虚拟知识Token。这些Token作为输入序列的前缀由于解码器仅在LLM中的单向注意力所有后续的文本Token都可以看到这些前缀。这样文本Token可以对输入三元组的结构嵌入进行单向注意从而在微调和推理期间实现结构感知提示。 KG-enhanced LMM Structure-CLIP通过场景图知识增强多模态结构化表示增强CLIP 出发点CLIP模型产生的通用表征能力无法区分那些包含相同单词但在结构化知识方面存在差异的文本段落。换言之CLIP模型表现出类似于词袋模型的特点未能有效理解和捕捉句子中的细粒度语义。思路通过场景图知识增强多模态结构化表示。与NegCLIP的随机交换方法不同Structure-CLIP采用了基于场景图的引导策略来进行单词交换以更精确地捕捉底层语义意图。此外还提出了一种知识增强编码器它利用场景图来提取关键的结构信息并通过在输入层面上融合结构化知识从而增强结构化表示的能力。KG-enhanced Prompt Engineering CoK诱导LLM生成结构三元组来提高CoT推理中的依据可信度 出发点旨在解决CoT中中间生成理由错误的问题方法是诱导LLM生成结构三元组的显式知识证据基于此还引入F2-Verification方法从事实性和忠实性两个方面来评估推理链的可靠性。对于不可靠的回答可以指出错误的证据促使LLM重新思考。主要创新点提示格式因为纯文本推理链不足以让LLM生成可靠而具体的推理过程。受知识库中三重结构的启发需要用结构化特征来增强提示。事后验证。LLM通常无法检查他们所回答的答案这就要求利用外部知识进行验证。方法CoK由两个主要部分组成即证据三元组CoK-ET和解释提示CoK-EH。CoK-ET代表一个由多个三元组组成的列表每个三元组都代表从大模型那里获得的知识证据以支持逐步思考的过程。在事实性验证上事实性可视为每个生成的三元组证据与知识库中的基本真实知识之间的匹配度。具体来说定义一个函数fv来表示每个证据的真实性。设计两种不同的fv策略精确验证和隐式验证。在忠实性验证上给定一个测试查询、一个证据三元组列表和最终答案直接将它们连接成一个新的序列利用预置的句子编码器SimCSE来计算新序列与先前序列之间的相似度最后对于每个查询可以得到一个分数Ci0Ci1表示该理由对答案是否可靠。当LLM生成的推理链未能通过验证且可靠性得分低于阈值θ时会在反思阶段为它们提供额外的再次生成机会。 BSChecker:将大模型输出分解为三元组分步进行幻觉检测 BSChecker其思想在于与传统的段落或句子级别的分析方法不同将大模型的输出文本分解成知识三元组该工作将幻觉检测的最小单元称为一个声明claim。在计算方式上不同于传统幻觉检测方法将整个输出文本分类为是否存在幻觉这两种类别标签BSChecker对输出文本中的每一个声明都进行幻觉检测并分类。输出文本和其相应的参考文本之间的关系可以分成蕴涵Entailment图中绿勾✅和矛盾Contradiction图中红叉❌以及中立图中的问号。BSChecker具有模块化的工作流程分为声明抽取器E幻觉检测器C以及聚合规则τ将输入文本分解成一组知识三元组。每个三元组都要经过验证验证。随后根据预定义的规则汇总各个结果以确定给定文本的整体幻觉标签。本质上是以文本抽取的多个三元组为评估基准来评估整个输出的幻觉可能。 Extractor使用GPT-4和Claude 2Checker使用大量现有的ZERO-SHOT校验器而无需额外的训练主要考虑两种类型基于LLM的检查器和基于NLI的检查器,在汇总阶段得到整个输入文本的整体幻觉标签。 graph-guided reasoning: 通过图表示/验证步骤引导CoT 包括如下几个步骤1. 图表示利用LLMs构建一个“问题/理由图”该图是一个有向无环图其中每个节点是一个问题或一个理由每条边是一个关系。图表示的目的是将问题和理由的语义结构显式地表示出来以便于后续的推理。2. 图验证利用LLMs对当前的理由节点进行诊断通过将其与现有的问题/理由图进行比较来过滤掉无关的理由并生成后续的问题以获取更多的相关信息。图验证的目的是检查和纠正当前的推理路径以避免错误或不完整的推理。3. 图补充利用LLMs生成不包含图中提取信息的CoT路径以表示图抽取中遗漏的上下文信息。图补充的目的是补充和完善当前的推理路径以提高推理的全面性和鲁棒性。 具体实现问题图构建是指利用大型语言模型从问题中提取知识三元组并将其表示为一个图结构。中间问题生成是指根据问题图中的三元组生成一个与初始问题相关的子问题以获取回答问题所需的信息。中间答案生成是指利用大型语言模型回答中间问题并生成一个作为推理步骤的中间答案。在开放领域的设置中还可以利用检索增强的方法根据中间问题作为查询从外部知识库中检索相关的段落以辅助中间答案的生成。理由验证是指将生成的中间答案转换为三元组的形式并与问题图进行匹配以验证其是否有效和有用。如果中间答案被拒绝就返回到中间问题生成的步骤。这个过程重复进行直到生成的理由图与问题图匹配或者达到重复的限制。然后大型语言模型根据所有的中间答案生成最终的答案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/923768.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

做汽车配件招聘网站徐州 网站建设

提示:Grounding DINO、TAG2TEXT、RAM、RAM论文解读 文章目录 前言一、Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection1、摘要2、背景3、部分文献翻译4、贡献5、模型结构解读a.模型整体结构b.特征增强结构c.解码结构 6、实…

wordpress 博客网站是免费的么wordpress首页文件夹

面向对象编程思想 1、什么是面向过程 传统的面向过程的编程思想总结起来就八个字——自顶向下,逐步细化! → 将要实现的功能描述为一个从开始到结束按部就班的连续的“步骤” → 依次逐步完成这些步骤,如果某一个步骤的难度较大&#xff…

网站开发岗位实际情况做ae动图的网站

一.IOU 1.GIOU解决没有交集的框,IOU为0,其损失函数导数为0,无法优化的问题。 图1 GIOU,IOU,l2范数差异 a)可看出 l2值一样,IOU值是不一样的,说明L1,L2这些Loss用于回归任务时,不能等价于最后用于评测检测的IoU. b)可看出当框有包含关系,GIOU就退化为IOU 其是找…

docker build 时报错 Error fail to solve

docker build 时报错 Error fail to solve,排查处理。问题:填写镜像源: 在Docke Desktop的设置中,选择Docker Engine, 填写: {"builder": {"gc": {"defaultKeepStorage": "20…

web图像触发防盗链,无法显示

web图像触发防盗链,背景却无非正常显示,但是音乐播放器和别的功能模块却可以正常访问网络加载的解决方法。问题 网页在Windows直接运行的时候一切正常,但是通过docker以后,浏览器通过localhost:12345访问时,背景却…

成都市网站建设费用及企业站长统计芭乐官方网站下载

第二章 SpringFramework 五、Spring AOP 面向切面编程 6. Spring AOP 基于 XML 方式实现(了解) 6.1 准备工作 加入依赖和基于注解的 AOP 时一样。准备代码把测试基于注解功能时的 Java 类复制到新 module 中,去除所有注解。 6.2 配置 Sp…

.NET操作Excel:单元格范围 (Range) 的精确定位与常用管理 (下)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

TCP的学习 - 实践

TCP的学习 - 实践2025-10-01 10:32 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-fami…

24届(华为OD)Java面经 - 教程

24届(华为OD)Java面经 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco&quo…

dw内部网站链接怎么做网页设计与网站建设专业

本系列文章是学习深蓝学院-移动机器人运动规划课程第五章最优轨迹生成 过程中所记录的笔记,本系列文章共包含四篇文章,依次介绍了微分平坦特性、无约束BVP轨迹优化、无约束BIVP轨迹优、 带约束轨迹优化等内容 本系列文章链接如下: 最优轨迹生…

每天半小时,轻松学Docker第一篇:Debian 12 无痛安装与初体验 - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

南宁网站制作费用it项目外包网

哈夫曼编码的设计与应用 问题需求分析 用哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长…

php网站访问很慢公司注册资金最低多少钱

Pass-14 (图片马,判断文件类型) 图片的格式在防护中通常是不会使用后缀进行判断的依据,文件头是文件开头的一段二进制码,不同类型的图片也就会有不同的二进制头。   JPEG (jpg),文件头:FF D…

2025上海骨灰盒哪里买优质厂家权威推荐榜:匠心工艺与品质服务之选

行业背景介绍 在殡葬文化中,骨灰盒承载着特殊的意义,它不仅是逝者最后的归宿,更是生者情感的寄托。随着社会的发展和人们观念的转变,对于骨灰盒的品质、工艺和文化内涵的要求也越来越高。上海作为国际化大都市,在…

实用指南:华为 HCIA-Datacom 备考:VRP 通用路由平台原理-实操

实用指南:华为 HCIA-Datacom 备考:VRP 通用路由平台原理-实操pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Co…

Voice Agent Camp 结营!完整项目名单公布丨超音速计划 2025

在过去的三个月里,17 个 Voice Agent 项目在超音速 Voice Agent Camp 里碰撞、打磨、成长。共同围绕「Voice First」理念,打造 AI 陪伴、个人助理、企业客服、AI 语音智能硬件等下一代产品。9 月 22 日,营员们带着阶…

详细介绍:SQL 执行异常排查 java.sql.SQLException:从 SQLException 说起

详细介绍:SQL 执行异常排查 java.sql.SQLException:从 SQLException 说起pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-famil…

做个外贸网站一般需要多少钱高校思政课网站建设

引言 在安卓开发中,视图绑定是一个关键的步骤,它允许开发者将布局文件中的视图组件与Activity或Fragment中的成员变量关联起来。这一机制不仅使得UI操作更加便捷,而且提高了开发效率。本文主要探讨了安卓开发中的一项重要技术——View Bindin…

2025上海寿衣哪里买权威推荐:优质供货商与暖心服务之选

上海寿衣厂家权威推荐:优质供货商与暖心服务之选 在中国传统文化中,寿衣作为人生最后一程的重要服饰,承载着对逝者的尊重与缅怀。随着社会对殡葬文化重视程度的提升,寿衣行业也逐步走向规范化、专业化发展。上海作…

AI 真能胜任专业工程师的工作吗?

AI 真能胜任专业工程师的工作吗? 近年来,人工智能(AI)的发展速度令人目不暇接,能够完成写诗、绘画、考试,甚至编写复杂的计算机代码。然而,有一个疑问始终在用户的心头环绕,得不到答案:这位“学霸”走出考场,…