Windows 10 GPU STACK 0.5.1 安装

Windows 10 GPU STACK 0.5.1 安装

  • 1 GPUStack 安装
    • 1.Python安装(3.10/11/12)
    • 2.GPUStack 下载
    • 3.生成密码
    • 4.访问
    • 5.设置模型下载目录
    • 6.禁用开机自启并重启服务
    • 7.安装模型
    • 8.查看安装的进度
  • 2.试验场聊天测试
    • 1.对话模式
  • 3.API Key 测试

1 GPUStack 安装

1.Python安装(3.10/11/12)

默认已安装,查看版本

python --version
pip --version

在这里插入图片描述

安装和初始化 PIPX

python -m pip install --user pipx
python -m pipx ensurepath

在这里插入图片描述

升级 PIP(谨慎操作)

python.exe -m pip install --upgrade pip

@

2.GPUStack 下载

Invoke-Expression (Invoke-WebRequest -Uri "https://get.gpustack.ai" -UseBasicParsing).Content

查看版本

gpustack version

在这里插入图片描述

3.生成密码

## Ab!123456
Get-Content -Path "$env:APPDATA\gpustack\initial_admin_password" -Raw

此密码可以直接使用,或者生成后修改为自己的密码

4.访问

http://localhost/

在这里插入图片描述

5.设置模型下载目录

查看源代码,找到如下位置,可通过设置环境变量值为 GPUStack 指定部分配置
在这里插入图片描述

新建一个空白文件夹,并配置系统环境变量,GPUSTACK_CACHE_DIR

在这里插入图片描述
查看是否生效

在这里插入图片描述

6.禁用开机自启并重启服务

打开 Windows 的服务管理页面

在这里插入图片描述

7.安装模型

以 DeepSeek-R1 1.5B 为例

在这里插入图片描述

8.查看安装的进度

模型列表

在这里插入图片描述

2.试验场聊天测试

1.对话模式

在这里插入图片描述

3.API Key 测试

新建一个 KEY

在这里插入图片描述

复制值:gpustack_005232ef37c19bbc_b4f2650cbba8fa9ca538f78d508ae102

在这里插入图片描述

调用,设置请求头和参数

在这里插入图片描述

请求头

Authorization Bearer gpustack_005232ef37c19bbc_b4f2650cbba8fa9ca538f78d508ae102

请求体

{"model": "deepseek-r1-1.5b","messages":[{"role": "user","content": "你好吗?"}]
}

返回值

{"id": "chatcmpl-jeoUHK3mBIFLaU6E4tQ7OVRHygBJcHtr","created": 1740382427,"model": "deepseek-r1-1.5b","object": "chat.completion","choices": [{"index": 0,"finish_reason": "stop","message": {"content": "<think>\n\n</think>\n\n你好!—I'm just here to help you out! What do you need to talk about or ask? 😊","role": "assistant"},"logprobs": null}],"usage": {"completion_tokens": 28,"prompt_tokens": 6,"total_tokens": 34,"time_to_first_token_ms": 127.332,"time_per_output_token_ms": 7.058928571428572,"tokens_per_second": 141.6645585631166}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/896238.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】快指针和慢指针

一、 给你单链表的头结点 head ,请你找出并返回链表的中间结点。如果有两个中间结点,则返回第二个中间结点。 要求&#xff1a;只遍历一遍链表 可以使用快慢指针&#xff1a;fast 一次走两步&#xff0c;slow 一次走一步。当 fast NULL&#xff08;偶数个结点&#xff09;或…

1.3 嵌入式系统的固件

嵌入式系统的固件&#xff0c;一般情况下的作用是: 1.硬件抽象层&#xff08;HAL&#xff09;&#xff1a;固件提供了一个硬件抽象层&#xff0c;它将硬件的复杂性隐藏起来&#xff0c;为上层软件提供了一套标准的接口。这样&#xff0c;操作系统和应用程序不需要直接与硬件打交…

中国工业互联网研究院:人工智能大模型年度发展趋势报告

当前&#xff0c;以大模型为代表的人工智能正快速演进&#xff0c;激发全球科技之变、产业之变、时代之变&#xff0c;人工智能发展迎来新高潮。随着大模型推理、多模态生成、智能体等创新技术的发展&#xff0c;大模型赋能千行百业将进一步提速。中国工业互联网研究院全方位剖…

【cv】vs2022配置opencv

release下配置包含目录和库目录 E:\sdk\sdk_cuda12.3\opencv490\include E:\sdk\sdk_cuda12.3\opencv490\include\opencv2 E:\sdk\sdk_cuda12.3\opencv490\lib release下配置包含链接器输入的依附依赖项 opencv_world490.lib release编译文件夹下需手动复制opencv_world49…

Python Pandas库使用指南:从入门到精通

1. 引言 Pandas 是 Python 中用于数据处理和分析的核心库之一。它提供了高效的数据结构(如 DataFrame 和 Series),能够轻松处理结构化数据,支持数据清洗、过滤、聚合、合并等操作。Pandas 在数据分析、机器学习和科学计算领域中被广泛使用。 本文将详细介绍 Pandas 的基本…

Visual Studio中打开多个项目

1) 找到解决方案窗口 2) 右键添加→ 选择现有项目 3) 选择.vcxproj文件打开即可

react路由总结

目录 一、脚手架基础语法(16~17) 1.1、hello react 1.2、组件样式隔离(样式模块化) 1.3、react插件 二、React Router v5 2.1、react-router-dom相关API 2.1.1、内置组件 2.1.1.1、BrowserRouter 2.1.1.2、HashRouter 2.1.1.3、Route 2.1.1.4、Redirect 2.1.1.5、L…

内外网隔离文件传输解决方案|系统与钉钉集成+等保合规,安全提升70%

一、背景与痛点 在内外网隔离的企业网络环境中&#xff0c;员工与外部协作伙伴&#xff08;如钉钉用户&#xff09;的文件传输面临以下挑战&#xff1a; 1. **安全性风险**&#xff1a;内外网直连可能导致病毒传播、数据泄露。 2. **操作繁琐**&#xff1a;传统方式需频繁切…

多线程篇学习面试

多线程 1.乐观锁、CAS思想 java乐观锁机制&#xff1a; ​ 乐观锁体现的是悲观锁的反面。它是一种积极的思想&#xff0c;它总是认为数据是不会被修改的&#xff0c;所以是不会对数据上锁的。但是乐观锁在更新的时候会去判断数据是否被更新过。乐观锁的实现方案一般有两种&a…

云服务器和物理服务器该如何选择

随着互联网的快速发展&#xff0c;企业大多都会选择云服务器和物理服务器进行使用&#xff0c;那么对于云服务器和物理服务器两者之间该如何进行选择呢&#xff1f; 云服务器可以为用户和企业提供网站处理中等到高流量所需要的一切&#xff0c;云服务器中的高可用能性功能&…

将产品照片(form.productPhotos)转为 JSON 字符串发送给后端

文章目录 1. 前端 form.productPhotos 的当前处理a. 组件绑定b. 当前发送逻辑 2. 如何将 form.productPhotos 转为 JSON 字符串发送给后端a. 修改前端 save() 方法b. 确保 esave API 支持接收字符串 基于你提供的 identify-form.vue 代码&#xff0c;我将分析如何将产品照片&a…

SpringCloud系列教程:微服务的未来(二十五)-基于注解的声明队列交换机、消息转换器、业务改造

前言 在现代分布式系统中&#xff0c;消息队列是实现服务解耦和异步处理的关键组件。Spring框架提供了强大的支持&#xff0c;使得与消息队列&#xff08;如RabbitMQ、Kafka等&#xff09;的集成变得更加便捷和灵活。本文将深入探讨如何利用Spring的注解驱动方式来配置和管理队…

国产编辑器EverEdit - 文本编辑器的关键特性:文件变更实时监视,多头编辑不掉坑

1 监视文件变更 1.1 应用场景 某些时候&#xff0c;用户会使用多个编辑器打开同一个文件&#xff0c;如果在A编辑器修改保存&#xff0c;但是B编辑器没有重新打开&#xff0c;直接在B编辑器修改再保存&#xff0c;则可能造成在A编辑器中修改的内容丢失&#xff0c;因此&#x…

HAProxy介绍与编译安装

目录 1、HAProxy介绍 2、HAProxy编译安装 Centos 基础环境 Ubuntu 基础环境 编译安装HAProxy 验证HAProxy版本 HAProxy启动脚本 配置文件 启动haproxy 验证haproxy状态 查看haproxy的状态页面 1、HAProxy介绍 HAProxy是法国开发者 威利塔罗(Willy Tarreau) 在2000年…

python类型转换深浅拷贝

1.类型转换 1.1 int(x):转化为一个整数&#xff0c;只能转换由纯数字组成的字符串 float->int 浮点型强转整形会去掉小数点后面的数&#xff0c;只保留整数部分 a 1.2 print(type(a)) #<class float> b int(a) print(type(b)) #<class int>print(int…

分布式光纤声波振动技术在钻井泄漏检测中的应用

在石油天然气的钻井作业中&#xff0c;及时发现并定位泄漏点对于保障开采安全、降低环境污染以及避免经济损失至关重要。传统的泄漏检测方法往往存在局限性&#xff0c;而分布式光纤声波振动技术凭借其独特的优势&#xff0c;正逐渐成为钻井过程中寻找泄漏的有力工具。 技术原理…

rtconfig.cpython-313.pyc 在 .gitignore文件中写入 *.pyc 文件仍然没有被忽略?

在 .gitignore 文件中添加 *.pyc 和 *.*.pyc 规则时&#xff0c;如果 .pyc 文件仍然没有被忽略&#xff0c;可能有以下几种原因&#xff1a; 1. 已经被 Git 跟踪的文件 即使您在 .gitignore 中指定了忽略 .pyc 文件&#xff0c;Git 仍然会跟踪已经被提交到版本库中的文件。如…

机器学习---KNN算法核心原理和思路分析

文章目录 1.算法介绍2.过拟合和欠拟合3.几种不同的距离4.特征的归一化处理 特此声明&#xff1a;该内容是学习耿直哥的相关机器学习理论&#xff0c;也是文章里面的部分图片素材的来源 1.算法介绍 KNN全称叫做K Nearset Neighbor,翻译之后就是K个最近的邻居&#xff1b; 其实…

书生大模型实战营14-MindSearch深度解析实践

文章目录 L2——进阶岛MindSearch深度解析实践1 MindSearch 简介2 开发环境配置2.1. 打开codespace主页&#xff0c;选择Blank模板进行创建2.2. 创建conda环境隔离并安装依赖 3. 获取硅基流动API KEY4. 启动MindSearch4.1. 启动后端4.2. 启动前端 5. 部署到自己的 HuggingFace …

uniapp实现app的pdf预览

实现效果 文件准备 static下添加该pdf文件&#xff08;下载地址&#xff1a;https://gitee.com/shallow-winds/resource_package/tree/master/%E6%96%B9%E6%B3%95%E4%B8%80/html&#xff09; 使用web-view进行展示&#xff1a; 在这里插入代码片 <web-view :src"u…