01、聊天与语言模型

一、简单说明模型

LLM目前有两种API提供

  • LanguageModel:接收一个a作为输入并返回一个b作为输出,这种是已经过时的
  • ChatLanguageModel:接收多个输入,然后返回相应的输出

ChatLanguaggeModel是LangChain4j中LLM交互低级API,它提供了最大的功能和灵活性。除此之外还有一个高级API(AIService)。

ChatLanguageModel还支持的模型有:

  • EmbeddingModel:把文本转换为Embedding
  • ImageModel:用来生成和编辑图片
  • ModerationModel:这个模型可以检查文本中是否包含有害内容
  • ScoringModel:可以根据查询对多段文本进行评分(排名),实际上就是用来确定每段文本与查询的关联性,这个对于RAG来说是非常有用的

二、ChatLanguageModel的API

ChatLanguageModel是一个接口,其定义如下:

public interface ChatLanguageModel {default String generate(String userMessage) {return generate(UserMessage.from(userMessage)).content().text();}default Response<AiMessage> generate(ChatMessage... messages) {return generate(asList(messages));}Response<AiMessage> generate(List<ChatMessage> messages);default Response<AiMessage> generate(List<ChatMessage> messages, List<ToolSpecification> toolSpecifications) {throw new IllegalArgumentException("Tools are currently not supported by this model");}default Response<AiMessage> generate(List<ChatMessage> messages, ToolSpecification toolSpecification) {throw new IllegalArgumentException("Tools are currently not supported by this model");}@Experimentaldefault ChatResponse chat(ChatRequest request) {throw new UnsupportedOperationException();}@Experimentaldefault Set<Capability> supportedCapabilities() {return emptySet();}
}

注意:现在我们看的是关于LangChain4j 0.36.2版本!!

三、关于ChatMessage

这个表示是一个聊天消息,当前有四种类型的聊天消息,每种消息的“来源”对应其中一种

  1. UserMessage:来自己于用户的消息,这里指的用户可以是应用使用的最终用户或者是应用本身,它是相对于LLM大语言模型来说的
  2. AiMessage:由AI生成的消息,通常是为了响应
  3. ToolExecutionResultMessage:聊天过程中执行相关的工具(函数)的结果
  4. SystemMessage:来自己系统的消息,通常用来定义LLM在对话中的角色说明(指定AI应该如何表现以及以何种方式回答...)
  5. CustomMessage:可以包含任意属性的自定义消息,这种消息不是所有的大模型语言都支持,只有支持它的才可以使用

使用多个ChatMessage

我们看到接口中方法定义为什么我们要使用多个ChatMessage?

注意:我们在于LLM进行聊天对话时,它本质上是无状态的,它们是不会维护对话状态的,如果要支持多论对话并且让AI理解对话的上下文,那么就需要使用到多个ChatMessage。因为这个时候我们就需要把多论对话中的所有聊天消息告诉AI,让它了解整个上下文的情况,从而达到一个有状态的假象。

如下所示:

UserMessage firstUserMessage = UserMessage.from("你好,我叫鹏鹏");
AiMessage firstAiMessage = model.generate(firstUserMessage).content();
UserMessage secondUserMessage = UserMessage.from("我叫什么名字?");
AiMessage secondAiMessage = model.generate(firstUserMessage,firstAiMessage,SecondUserMessage).content();

向上面这样手动去维护与管理这些消息是很麻烦的,实际的使用中我们会使用ChatMemory(先了解后续会说)

关于UserMessage

在UserMessage这个类中我们可以看到下面这个方法:

public static UserMessage userMessage(Content... contents) {return from(contents);
}

这个方法可以传入多个Content,最终得到一个UserMessage对象

而Content是一个接口,它有如下一些实现(不同的实现可以传入不同类型的内容)

  • TextContent
  • ImageContent
  • AudioContent
  • VideoContent
  • PdfFileContent

通过这些不同的Content我们就可以把不同类型的内容转为UserMessage,然后传给LLM,如下所示:

UserMessage userMessage = UserMessage.from(TextContent.from("请描述下面的图片信息"),ImageContent.from("https://ex.com/myCat.png")
);
Response<AiMessage> response = model.generate(userMessage);
TextContent

它是最为简单的一种,就是把一个普通的文本转为一个字符串

UserMessage.from(TextContent.from("Hello")) 与 UserMessage.from("Hello")这两者没有任何区别。

一次可以向UserMessage当中提供一个或多个TextContent

UserMessage userMessage = UserMessage.from(TextContext.from("Hello"),TextContext.from("你好啊!"));
ImageContent

根据不同的LLM提供商,ImageContent可以从URL地址或者Base64的二进制数据来提供ImageContent

如下所示,使用Base64的二进数据来提供ImageContent

byte[] imageBytes = readBytes("D:\\myImage\\hi.png");
String imgData = Base64.getEncoder().encodeToString(imageBytes);
ImageContent imageContent = ImageContent.from(imgData,"image/png");
UserMessage userMessage = UserMessage.from(imageContent);
AudioContent

它类似于ImageContent,它表示的是音频内容

VideoContent

它类似于ImageContent,它表示的是视频内容

PdfFileContent

它类似于ImageContent,表示的是PDF文件的二进制内容

四、实践示例

POM依赖

<dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-dashscope-spring-boot-starter</artifactId><!-- 添加排除项 --><exclusions><exclusion><groupId>org.slf4j</groupId><artifactId>slf4j-simple</artifactId></exclusion></exclusions></dependency><!-- lombok --><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId><optional>true</optional></dependency><dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j</artifactId></dependency>
</dependencies>

其中SpringBoot指定版本为:3.3.5,langchain4j指定版本为0.36.2

yml配置

langchain4j:dashscope:chat-model:api-key: sk-09a****************3686d6c4cfb#model-name: deepseek-v3model-name: qwen-max-latestchat:systemMessage: 你是普京,接下来以普京的语气来进行对话

其中aipkey是在阿里百炼平台申请的aipkey,这里要使用时需要替换为自已申请好的apikey

主启动

@SpringBootApplication
public class ChatApplication {public static void main(String[] args) {SpringApplication.run(ChatApplication.class, args);}
}

controller

@Slf4j
@RestController
@RequestMapping("/chat")
public class ChatController {// 注入聊天大语言模型@Resourceprivate ChatLanguageModel chatLanguageModel;@Value("${chat.systemMessage}")private String systemMessage;@GetMapping("/simple")public String chat(@RequestParam("message") String message) {UserMessage userMessage = UserMessage.from(message);Response<AiMessage> generate = chatLanguageModel.generate(userMessage);log.info("generate: {}", generate);return generate.content().text();}@GetMapping("/sys/simple")public String chatSys(@RequestParam("message") String message) {Response<AiMessage> aiResponse;UserMessage userMessage = UserMessage.from(message);if (systemMessage != null && !systemMessage.isEmpty()) {SystemMessage systemMessage = SystemMessage.from(this.systemMessage);aiResponse = chatLanguageModel.generate(List.of(systemMessage, userMessage));} else {aiResponse = chatLanguageModel.generate(userMessage);}if (aiResponse == null) {return "大模型未返回任何内容~~~";}log.info("generate: {}", aiResponse);return aiResponse.content().text();}
}

这其中有两个不同的请求,一个是简单的聊天请求,另一个是我们指定了特定的SystemMessage的请求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/74351.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQL的DCL,DDL,DML和DQL分别是什么

SQL&#xff08;Structured Query Language&#xff09;包括以下四种主要语言类别&#xff0c;分别用于不同的数据库操作&#xff1a; 1. DCL&#xff08;Data Control Language&#xff0c;数据控制语言&#xff09; 用于控制数据库访问权限和安全。 常见命令&#xff1a; …

spring boot maven一栏引入本地包

1、在项目跟目录下建立文件夹&#xff0c;比如libs 2、maven依赖 <dependency><groupId>com.hikvision.ga</groupId><artifactId>artemis-http-client</artifactId><version>1.1.10</version><scope>system</scope>&l…

连续型随机变量及其分布

连续型随机变量 数学公式可以看作一门精确描述事物的语言&#xff0c;比语言尤其是汉语的模糊性精确多了&#xff01;离散型数据的处理可以通过枚举和相加进行处理。而连续型数据则没有办法这样处理。我们必须要通过函数和取值区间还有微积分计算。 &#xff3b;定义1&#x…

AI重构SEO关键词优化路径

内容概要 人工智能技术的深度应用正在推动SEO优化进入全新阶段。传统关键词优化依赖人工经验与静态规则&#xff0c;存在效率瓶颈与策略滞后性缺陷。AI技术通过智能语义分析系统&#xff0c;能够穿透表层词汇限制&#xff0c;精准捕捉用户搜索意图的语义关联网络&#xff0c;结…

turnjs图册翻书效果

npm install https://github.com/igghera/turn.js.git //或者 npm install turn.js //import $ from "jquery"; //记得引入jquery import turn.js; // 引入 Turn.jsimport turn from "/utils/turn.min.js";// 引入 Turn.jsinitBook(length) {var that thi…

用PostgreSQL玩转俄罗斯方块:当SQL成为游戏引擎

当DBA开始摸鱼2025年某深夜&#xff0c;一位不愿透露姓名的DBA为了在监控大屏上隐藏游戏行为&#xff0c;竟用SQL实现了俄罗斯方块&#xff01;从此&#xff0c;SELECT成了方向键&#xff0c;UPDATE成了旋转指令&#xff0c;DELETE成了消除大招。本文将揭秘这个疯狂项目的技术内…

计算机网络层超全解析:从IP协议到路由算法

&#x1f310; &#xff08;专业详解生活化类比&#xff0c;逻辑一镜到底&#xff09; &#x1f4d6; 网络层的核心使命 核心任务&#xff1a;在不同网络间为数据包选择最佳路径&#xff0c;实现端到端通信。 类比&#xff1a;快递公司总部&#xff08;网络层&#xff09;根据…

代码随想录算法训练营第38天 | 322. 零钱兑换 279.完全平方数 139.单词拆分 背包问题总结

322. 零钱兑换 如果求组合数就是外层for循环遍历物品&#xff0c;内层for遍历背包。 如果求排列数就是外层for遍历背包&#xff0c;内层for循环遍历物品。 钱币有顺序和没有顺序都可以&#xff0c;都不影响钱币的最小个数。 视频讲解&#xff1a;动态规划之完全背包&#xff0…

关于网络的一点知识(持续更新)

1、IP地址和子网掩码、端口号: IP地址是设备在网络上的地址,相当于一栋房子的门牌号。子网掩码相当于房子所在的街道。同一条街道的房子间是通过街道直通的,主人可以互相拜访。 举个例子,如下图所示。 说明:将两台设备的IP和子网掩码转化为二进制,然后将各自的IP地址和…

Idea中使用Git插件_合并当前分支到master分支_冲突解决_很简单---Git工作笔记005

由于之前用svn习惯了,用的git少,其实在idea中使用git,解决冲突,合并分支,非常的简单,一起来看一下吧. 一定要注意操作之前,一定要确保自己的分支代码,都已经commit提交了,并且push到远程了. 不要丢东西. 可以看到首先,在idea的左下角有个 git,点开以后 可以看到有显示的分支…

[自动化] 【八爪鱼】使用八爪鱼实现CSDN文章自动阅读脚本

在CSDN上&#xff0c;文章的阅读量往往是衡量内容影响力的一个重要指标。为了测试自动化手段能否提高阅读数&#xff0c;我尝试使用网页自动化工具来模拟人工阅读某个ID的文章。 1. 网页自动化的常见方案 谈到网页自动化&#xff0c;Selenium 是一个最常见的选择。它可以通过…

Linux 系统性能优化高级全流程指南

Linux 系统性能优化高级全流程指南 一、系统基础状态捕获 1. 系统信息建档 除了原有的硬件、内核和存储拓扑信息收集&#xff0c;还增加 CPU 缓存、网络设备详细信息等。 # 硬件信息 lscpu > /opt/tuning/lscpu.origin dmidecode -t memory > /opt/tuning/meminfo.or…

常⻅中间件漏洞--Tomcat

tomcat是⼀个开源⽽且免费的jsp服务器&#xff0c;默认端⼝ : 8080&#xff0c;属于轻量级应⽤服务器。它可以实现 JavaWeb程序的装载&#xff0c;是配置JSP&#xff08;Java Server Page&#xff09;和JAVA系统必备的⼀款环境。 1.CVE-2017-12615 Tomcat put⽅法任意⽂件写…

数据结构之栈(C语言)

数据结构之栈&#xff08;C语言&#xff09; 栈1 栈的概念与结构2 栈的初始化和销毁2.1 栈的初始化2.2 栈的销毁 3 入栈函数与出栈函数3.1 入栈函数3.2 出栈函数 4 取栈顶数据&#xff0c;获取数据个数 和 判空函数4.1 取栈顶数据与获取数据个数4.1.1 取栈顶数据4.1.2 获取数据…

datawhale组队学习--大语言模型—task4:Transformer架构及详细配置

第五章 模型架构 在前述章节中已经对预训练数据的准备流程&#xff08;第 4 章&#xff09;进行了介绍。本章主 要讨论大语言模型的模型架构选择&#xff0c;主要围绕 Transformer 模型&#xff08;第 5.1 节&#xff09;、详细 配置&#xff08;第 5.2 节&#xff09;、主流架…

BP神经网络+NSGAII算法(保真)

BP神经网络NSGAII算法 非常适合用来当作实验验证自己的结论&#xff0c;构建一个神经网络模型&#xff0c;并使用NSGAII多目标优化算法来实现多领域的毕业论文的设计。仅仅使用简单的matlab代码就可以实现自己的多目标优化任务。 BP神经网络算法 我的任务是预测三个变量的值…

MCU vs SoC

MCU&#xff08;Microcontroller Unit&#xff0c;单片机&#xff09;和SoC&#xff08;System on Chip&#xff0c;片上系统&#xff09;是两种不同的芯片类型&#xff0c;尽管它们都实现了高度集成&#xff0c;但在设计目标、功能复杂性和应用场景上存在显著差异。以下是两者…

3.23学习总结

字符串 String java.lang,String 类代表字符串&#xff0c;Java程序中所有的字符串文字都为此类的对象 字符串的内容是不会发生改变的&#xff0c;它的对象在创建之后不能呗更改 字符串的内存模型 当使用双引号直接赋值时&#xff0c;系统会检查该字符串在串池中是否存在。 …

01测试分类

一、按照测试目标分类 1、界面测试 肉眼所看到的一切&#xff0c;都需要进行测试。如&#xff0c;按钮的点击&#xff1b;输入框输入文本&#xff1b;下拉框的选择&#xff1b;其它的交互等。。。 前端开发在执行开发之前需要交互/设计的同学给出设计图&#xff08;以图片的…

【Git】用Git命令克隆一个远程仓库、修改仓库中的文件,并将更改推送到远程仓库

git clone ssh://gitgithub.com:2222/Mermaid28/Groove.git # SSH地址cd rfnvtoolecho "# rfnvtool" > README.md git add README.mdgit commit -m "add README" git push -u origin master 这个一系列的 Git 命令涉及到克隆一个远程仓库、修改仓库中…