做网站公司信科建站免费招商网站搭建费用
news/
2025/9/24 5:17:15/
文章来源:
做网站公司信科建站免费,招商网站搭建费用,东莞seo优化联系电话,可以做ppt的网站文章目录 大模型开发范式RAGLangChain框架#xff1a;构建向量数据库构建检索问答链优化建议web 部署 实践部分 大模型开发范式
LLM的局限性#xff1a;时效性#xff08;最新知识#xff09;、专业能力有限#xff08;垂直领域#xff09;、定制化成本高#xff08;个… 文章目录 大模型开发范式RAGLangChain框架构建向量数据库构建检索问答链优化建议web 部署 实践部分 大模型开发范式
LLM的局限性时效性最新知识、专业能力有限垂直领域、定制化成本高个人专属
两种开发范式
RAG检索增强生成外挂知识库首先匹配知识库文档交给大模型。优势成本低实时更新不需要训练。但受限于基座模型知识有限总结性回答不佳。Finetune微调轻量级训练微调可个性化微调是一个新的个性化大模型。但是需要在新的数据集上训练更新成本仍然很高无法解决实时更新的问题。
RAG
基本思想
LangChain框架
通过组件组合进行开发自由构建大模型应用。将私人数据嵌入到组件中。 步骤首先Unstructed Loader 组件加载本地文档将不同格式的文档提取为纯文本格式。通过Text Splitter组件对提取的纯文本进行分割成Chunk。再通过开源词向量模型Sentence Transformer来将文本段转化为向量格式存储到基于Chroma的向量数据库中接下来对用户的每个输入会通过Sentence Transformer转为为同样维度的向量通过在向量数据库中进行相似度匹配找到和用户输入的文本段将相关的文本段嵌入到已经写好的Prompt Template中最后交给LLM回答即可。
构建向量数据库
基于个人数据构建向量数据库。LangChain支持自定义LLM可以直接接入到框架中。
多种数据类型针对不同类型选取不同加载器转化为无格式字符串。由于单个文档超过模型上下文上限还需要对文档进行切分。使用向量数据库支持语义检索需要将文本向量化存入向量数据库
构建检索问答链
自动实现知识检索、Prompt嵌入、LLM问答。 问答性能还有所局限 优化建议
基于语义切分而不是字符串长度。 给每个chunk生成概括性索引。
web 部署
简易框架Gradio、Streamlit等
实践部分
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/914936.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!