运行fastGPT 第四步 配置ONE API 添加模型

上次已经装好了所有的依赖和程序。

下面在网页中配置One API ,这个是大模型的接口。配置好了之后,就可以配置fastGPT了。

打开 OneAPI 页面 添加模型

这里要添加具体的付费模型的API接口填进来。
可以通过ip:3001访问OneAPI后台,**默认账号为root密码为123456。**在OneApi中添加合适的AI大模型渠道。 比如我用质谱AI的API。

在这里插入图片描述
第一次进入,先改密码。

创建渠道 也就是质谱AI的渠道 API KEY 添加进去

添加渠道,也就是添加模型 和接口。
在这里插入图片描述
这里,比如我想添加GLM质谱AI的大模型,那么就去官网找到这个。找到具体的模型名字。因为我是用作 AI聊天客服,应对日常咨询。因此不需要强大的推理,而是需要急速回答,和便宜。
https://www.bigmodel.cn/pricing
在这里插入图片描述在这里插入图片描述
找到以上的就可以了,向量模型用来处理文本,和知识库的信息。所以要一同加入。
注意,这里要手动填入模型的完整名字哦。否则列表中可能没有。 有些新的模型版本,需要自己填写。
然后在你的大模型网站上,找到API KEY 粘贴进去,就可以了。 每次就会扣费了。
在这里插入图片描述
测试一下,这里通过了,表示模型已经就位。 可以调用了。

在这里插入图片描述

创建ONE API的令牌

创建令牌 其实也就是ONE API 的KEY 用于给fastGPT调用。
在这里插入图片描述
创建了新的令牌TOKEN之后,你就能复制它了,就是一串密钥sk开头的

然后fastGPT通过这个,来调用你的ONE API上的接口。 从而扣费。 这样就能实现对个人的管理了。 你可以通过ONE API来多给别人建立几个TOKEN ,每个人单独扣费。你能在后台看到他们的费用情况。

在这里插入图片描述
当然,您只是自己用,就随便。 给自己随便填写一个额度。使劲用就行。 保证您的大模型接口上有钱就行。

修改ONE API配置文件 添加参数

找到上一篇文章中的/fastgpt/docker-compose.yml 这个文件,修改下面的参数。 把你的ONE API得到的token粘贴进去。
好了,sk-xxxxxxXU73hQgQ6DaB01601610e41B992995cD929C6C4Ec,我的是这样的。
在这里插入图片描述
把oneapi,改成你的 ip。 把 ip填进去替换oneapi就行,其它的不用改

修改FastGPT配置文件 向其中添加模型信息

然后在去修改另一文件。/fastgpt/config.json
为fastGPT添加新模型GLM-4-AirX ,这个是和我们前面ONE API里加入的名字要一致。

 {"provider": "ZhiPu","model": "GLM-4-AirX",  // 新添加的模型"name": "GLM-4-AirX","maxContext": 8000,  // 你可以根据需要设置最大上下文"maxResponse": 4000,  // 最大回复"quoteMaxToken": 8000,// 最大引用内容"maxTemperature": 1,// 最大温度"charsPointsPrice": 0.01,  // n积分/1k token(商业版)"censor": false,// 是否开启敏感校验(商业版)"vision": false,// 是否支持图片输入"datasetProcess": true,"usedInClassify": true,"usedInExtractFields": true,"usedInToolCall": true,"usedInQueryExtension": true,"toolChoice": true,"functionCall": false,"customCQPrompt": "","customExtractPrompt": "","defaultSystemChatPrompt": "","defaultConfig": {"top_p": 0.7 },// 请求API时,挟带一些默认配置(比如 GLM4 的 top_p)"fieldMap": {}}

在这里插入图片描述

添加向量模型

   {"provider": "ZhiPu","model": "embedding-2",    // 模型名(与OneAPI对应)"name": "embedding-2",     // 模型展示名"charsPointsPrice":0.0005, // n积分/1k token"defaultToken": 700,       // 默认文本分割时候的 token"maxToken": 3000,          // 最大 token"weight": 100,             // 优先训练权重"defaultConfig": {} // 自定义额外参数。例如,如果希望使用 embedding3-large 的话,可以传入 dimensions:1024,来返回1024维度的向量。(目前必须小于1536维度)}

在这里插入图片描述
在这里插入图片描述

特别要注意的是,这个名子的大小写,千万不要写错了。 它一会儿大写一会儿小写。 错了的话,就找不到接口。报错了。
在这里插入图片描述

好了。然后在宝塔面板中,重启这两个docker

ok,搞定了,下面就是去配置FastGPT了。 下一篇文章见~。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/68372.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RocketMQ 学习笔记01

一、MQ简介 1. 什么是MQ? MQ(Message Queue,消息队列) 是一种在分布式系统中用于实现进程间通信和数据传输的中间件。它通过在不同进程或应用程序之间传递消息,实现数据的异步处理、解耦和削峰填谷等功能。MQ广泛应用…

梁山派入门指南3——串口使用详解,包括串口发送数据、重定向、中断接收不定长数据、DMA+串口接收不定长数据,以及对应的bsp文件和使用示例

梁山派入门指南3——串口使用详解,包括串口发送数据、重定向、中断接收不定长数据、DMA串口接收不定长数据,以及对应的bsp文件和使用示例 1. 串口发送数据1.1 串口简介1.2 梁山派上的串口开发1.3 bsp_uart文件(只发送不接收,兼容串…

pnpm add 和 pnpm install 的区别?

文章目录 1. pnpm add2. pnpm install3. 总结应用场景示例 在使用 pnpm 管理项目依赖时, pnpm add 和 pnpm install 是两个常用的命令,但它们的功能和使用场景有所不同。以下是详细的解释: 1. pnpm add 功能:用于向项目的 pack…

Linux和Docker常用终端命令:保姆级图文详解

文章目录 前言1、Docker 常用命令1.1、镜像管理1.2、容器管理1.3、网络管理1.4、数据卷管理1.5、监控和性能管理 2、Linux 常用命令分类2.1、文件和目录管理2.2、用户管理2.3、系统监控和性能2.4、软件包管理2.5、网络管理 前言 亲爱的家人们,创作很不容易&#xf…

智能科技与共情能力加持,哈曼重新定义驾乘体验

2025年1月6日,拉斯维加斯,2025年国际消费电子展——想象一下,当您步入一辆汽车,它不仅能响应您的指令,更能理解您的需求、适应您的偏好,并为您创造一个独特且专属的交互环境。作为汽车科技领域的知名企业和…

关于2025年智能化招聘管理系统平台发展趋势

2025年,招聘管理领域正站在变革的十字路口,全新的技术浪潮与不断变化的职场生态相互碰撞,促使招聘管理系统成为重塑企业人才战略的关键力量。智能化招聘管理系统平台在这一背景下迅速崛起,其发展趋势不仅影响企业的招聘效率与质量…

机器视觉5-全连接神经网络

机器视觉5-全连接神经网络1 图像表示多层感知器全连接神经网络一、两层全连接网络表达式二、三层全连接网络表达式三、关于非线性操作的说明四、全连接神经网络的映射原理 全连接神经网络的权值一、线性分类器二、两层全连接网络三、总结 全连接神经网络线性不可分全连接神经网…

解锁转型密码:不同方向的技能与素质修炼手册

前言:哈喽,大家好,今天给大家分享一篇文章!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 解锁…

ChatGPT提示词合集(国内大模型可参考使用)

行为迅速的Linux终端我想让你充当 linux 终端。我将输入命令,您将回复终端应显示的内容。我希望您只在一个唯一的代码块内回复终端输出,而不是其他任何内容。不要写解释。除非我指示您这样做,否则不要键入命令。当我需要用英语告诉你一些事情…

第三十八章 Spring之假如让你来写MVC——适配器篇

Spring源码阅读目录 第一部分——IOC篇 第一章 Spring之最熟悉的陌生人——IOC 第二章 Spring之假如让你来写IOC容器——加载资源篇 第三章 Spring之假如让你来写IOC容器——解析配置文件篇 第四章 Spring之假如让你来写IOC容器——XML配置文件篇 第五章 Spring之假如让你来写…

深度剖析RabbitMQ:从基础组件到管理页面详解

文章目录 一、简介二、Overview2.1 Overview->Totals2.2 Overview->Nodesbroker的属性2.3 Overview->Churn statistics2.4 Overview->Ports and contexts2.5 Overview->Export definitions2.6 Overview->Import definitions 三、Connections连接的属性 四、C…

使用 Python 编写一个简单的聊天机器人

💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长…

Unity 自定义批量打包工具

打包配置项 using UnityEngine; using System.Collections.Generic;namespace MYTOOL.Build {[System.Flags]public enum VersionOptions{None 0,Major 1,Minor 4,Build 8,Revision 0x10,}/// <summary>/// 批量打包配置文件/// </summary>[CreateAssetMenu]…

什么是基础镜像

基础镜像是一个在虚拟化技术和容器化技术中广泛使用的概念&#xff0c;具体定义和用途如下&#xff1a; 一、定义 基础镜像&#xff08;Base Image&#xff09;是指操作系统程序及其附加文件的一个复制品&#xff0c;在云服务行业中通常称为系统镜像&#xff08;System Image…

JAVA实现五子棋小游戏(附源码)

文章目录 一、设计来源捡金币闯关小游戏讲解1.1 主界面1.2 黑棋胜利界面1.3 白棋胜利界面 二、效果和源码2.1 动态效果2.2 源代码 源码下载更多优质源码分享 作者&#xff1a;xcLeigh 文章地址&#xff1a;https://blog.csdn.net/weixin_43151418/article/details/145161039 JA…

Flink概述

一、Flink是什么 二、Flink特点 三、Flink vs SparkStreaming 表 Flink 和 Streaming对比 Flink Streaming 计算模型 流计算 微批处理 时间语义 事件时间、处理时间 处理时间 窗口 多、灵活 少、不灵活&#xff08;窗口必须是批次的整数倍&#xff09; 状态 有 …

基于SpringBoot的企业级工位管理系统【源码+文档+部署讲解】

系统介绍 基于SpringBootVue实现的企业级工位管理系统采用前后端分离架构方式&#xff0c;系统设计了管理员、员工两种角色&#xff0c;系统实现了用户登录与注册、个人中心、员工管理、部门信息管理、工位信息管理、使用情况管理、工位分配管理等功能。 技术选型 开发工具&…

【计算机体系结构、微架构性能分析】core 与 uncore 分别是哪一些部分?区分 core 和 uncore

在计算机体系结构中&#xff0c;Core 和 Uncore 是描述处理器内部架构的两个重要概念&#xff0c;尤其在多核处理器中更为常见。 1. Core&#xff08;核心&#xff09; Core 指的是处理器中的计算核心&#xff0c;是执行指令和处理数据的基本单元。每个核心都包含独立的执行单…

数据结构——线性表和顺序表

1、线性表的基本概念 1.1 定义 线性结构是简单且常用的数据结构&#xff0c;而线性表则是一种典型的线性结构 存储数据&#xff0c;最简单&#xff0c;最有效的方法是吧它们存储在一个线性表中 一个线性表是n个元素的有限序列。每个元素在不同的情况下有不同的含义&#xff0c…

Windows图形界面(GUI)-QT-C/C++ - QT 窗口属性

公开视频 -> 链接点击跳转公开课程博客首页 -> ​​​链接点击跳转博客主页 目录 标题栏 基本概念 设置窗口标题 隐藏标题栏 UI编辑器 窗口关闭事件 窗口大小调整事件 窗口移动事件 自定义标题栏 菜单栏 基本概念 设置菜单栏(API) 设置菜单栏(UI) 工具栏 …