私有化部署千问3-8B

news/2026/1/23 10:24:03/文章来源:https://www.cnblogs.com/lyc-code/p/19520825

1、算力云租用一张4090显卡

算力云地址:https://autodl.com/console/instance/list?

tag_id=&_random_=1760162242450

2、在魔塔社区找到千问大模型下载地址,拷贝下载方式,使用sdk下载

https://www.modelscope.cn/models/Qwen/Qwen3-8B

4090显卡只支持8B大模型

3、打开算力云,创建download.py文件

#模型下载

from modelscope import snapshot_download

model_dir = snapshot_download('Qwen/Qwen3-8B', cache_dir='/root/autodl-tmp/models', revision='master')

4、pip install modelscope 后运行python ~/autodl-tmp/code/download.py

5、pip install vllm,使用vllm部署,vllm支持高并发,ollama有风险

6、python -m vllm.entrypoints.openai.api_server \
--model /root/autodl-tmp/models/Qwen/Qwen3-8B \
--served-model-name qwen3-8b \
--max-model-len 8k \
--host 0.0.0.0 \
--port 6006 \
--dtype bfloat16 \
--gpu-memory-utilization 0.8 \
--enable-auto-tool-choice \
--tool-call-parser hermes

使用命令启动大模型

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1204450.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对比:手动搜索VS AI生成VISIO2013密钥的效率差异

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个效率对比工具,模拟手动搜索和AI生成VISIO2013密钥的全过程。工具需记录两种方式的时间消耗、成功率及安全性,生成可视化报告,直观展示A…

AI如何帮你解决RDP Wrapper安装失败问题

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个Windows系统诊断工具,专门用于检测和修复RDP Wrapper安装问题。功能包括:1) 自动检测系统版本和RDP Wrapper兼容性 2) 扫描常见安装错误(如termsrv…

查看会话数

使用 pg_stat_activity 系统视图(最常用) sql -- 查看所有活动会话 SELECT COUNT(*) as total_connections FROM pg_stat_activity;-- 查看详细信息 SELECT datname as database, usename as username, client_addr …

CVE-2016-2183全面修复指南:从检测到防护

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个CVE-2016-2183修复指南,包含以下内容:1. 漏洞检测工具和方法;2. Windows/Linux/Unix等各操作系统的具体修复步骤;3. 主流We…

2026年质量好的陕西橡胶密封制品_橡胶空气弹簧厂家推荐及选购指南

2026年质量好的陕西橡胶密封制品/橡胶空气弹簧厂家推荐及选购指南在机械制造、航天军工、轨道交通、车辆装备等行业的生产运营中,**陕西橡胶密封制品**、橡胶空气弹簧、气动悬挂、减震气囊、橡胶皮囊等核心配件,直接…

Qwen3-1.7B避坑指南:部署与调用常见问题全解析

Qwen3-1.7B避坑指南:部署与调用常见问题全解析 1. 为什么需要这份避坑指南? 你刚下载完Qwen3-1.7B镜像,兴奋地点开Jupyter,复制粘贴了文档里的LangChain调用代码,却卡在ConnectionRefusedError; 你反复确…

clarify

clarifyclarify = 当用户需求不明确时,让模型或 Agent 向用户提问以获取更多信息用户输入↓ Agent / LLM 尝试生成 schema↓ 发现缺信息↓ 生成 clarify prompt → 问用户↓ 用户回答↓ 继续生成 schema特性repaircla…

Vue新手必看:为什么我的onMounted不工作?

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个交互式学习模块,通过渐进式示例引导Vue新手理解onMounted钩子。从最简单的组件开始,逐步添加复杂度,在每个步骤中突出显示可能导致无组…

Qwen-Image-Edit-2511新手教程,5步快速掌握

Qwen-Image-Edit-2511新手教程,5步快速掌握 1. 前言:为什么你需要了解Qwen-Image-Edit-2511 你是不是也遇到过这样的问题:想换张照片的背景,结果人物脸变了?想改一下衣服颜色,结果整个人都走形了&#xf…

从“好用”到“用好”:穿孔机性价比之王深度拆解

在精密加工领域,穿孔机作为实现微小孔径、复杂孔型加工的核心装备,早已从“可有可无”成为“刚需必备”。从最初追求“能用、好用”的基础需求,到如今聚焦“高效、节能、低成本、高适配”的“用好”进阶需求,企业在…

GPU资源紧张?DeepSeek-R1-Distill-Qwen-1.5B CPU兼容方案

GPU资源紧张?DeepSeek-R1-Distill-Qwen-1.5B CPU兼容方案 你是不是也遇到过这种情况:手头有个不错的推理模型想跑,但GPU显存不够,服务起不来?或者服务器上多个任务抢卡,根本排不上队?今天要聊的…

POTPLAYER在家庭影院中的实际应用

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个家庭影院配置指南,详细说明如何将POTPLAYER与家庭影院系统(如投影仪、音响)结合使用。包括硬件连接、软件设置(如音频输出、…

VS2022官网新功能:AI代码补全实战指南

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个演示VS2022 AI辅助功能的示例项目,包含:1) 智能代码补全演示 2) 实时错误检测示例 3) AI建议重构案例 4) 代码风格优化建议。使用C#语言&#xff0…

Qwen图像生成器商业变现路径:儿童IP衍生品开发实战案例

Qwen图像生成器商业变现路径:儿童IP衍生品开发实战案例 1. 从一张小熊图开始的生意机会 你有没有想过,一个看起来简单的“毛茸茸小熊穿背带裤”提示词,背后可能是一整条儿童IP衍生品的起跑线? 这不是概念演示,而是真…

从零开始学习使用QORDER平台快速创建功能完整的订单管理应用,无需编程基础也能轻松上手。

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个面向新手的订单管理系统教学项目,要求:1. 极简UI界面设计 2. 分步指导注释 3. 内置示例数据 4. 一键测试功能 5. 常见问题解答模块。使用最基础的H…

BERT填空预测不准?置信度可视化调优实战教程来帮你

BERT填空预测不准?置信度可视化调优实战教程来帮你 1. 为什么填空结果总让你“将信将疑” 你是不是也遇到过这种情况:输入一句“春风又绿江南岸,明月何时照我[MASK]”,模型却返回了“归”(72%)、“回”&a…

AI助力MySQL8下载与配置:一键搞定开发环境

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个MySQL8自动下载配置助手,功能包括:1.自动检测用户操作系统类型和版本 2.推荐最适合的MySQL8发行版(社区版/企业版)3.生成一…

电商APP全机型测试:基于快马平台的自动化解决方案

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个电商APP多机型测试系统,自动生成包含主流安卓机型配置的模拟器集群(覆盖Android 8-13)。要求能自动部署测试环境,生成UI自动…

YOLO11显存占用高?梯度累积优化实战教程

YOLO11显存占用高?梯度累积优化实战教程 你是不是也遇到过这样的问题:想用YOLO11训练自己的目标检测模型,刚跑起train.py就报错CUDA out of memory?明明显卡有24GB显存,却连batch_size8都撑不住?别急——这…

金融合规审查新方案:gpt-oss-20b-WEBUI结构化输出

金融合规审查新方案:gpt-oss-20b-WEBUI结构化输出 在银行风控部门,法务团队正逐条核对一份跨境并购协议;证券公司合规岗深夜处理上百份基金销售话术材料;保险机构需在48小时内完成新产品条款的监管报备——这些场景背后&#xff…