ModelScope(魔搭)下载模型通过 vLLM 启动服务,并开放端口给 Windows 访问

source ~/vllm-env/bin/activate # 基础依赖 pip install modelscope vllm
import os from modelscope import snapshot_download # ====================== # 配置模型 # ====================== LLM_MODEL = "Qwen/Qwen2.5-0.5B" VLM_MODEL = "OpenBMB/MiniCPM-V-2_6-int4" # 或 MiniCPM-V-2_6(非量化) LLM_DIR = f"./models/{LLM_MODEL.replace('/', '_')}" VLM_DIR = f"./models/{VLM_MODEL.replace('/', '_')}" # ====================== # 下载模型(ModelScope) # ====================== for name, path in [(LLM_MODEL, LLM_DIR), (VLM_MODEL, VLM_DIR)]: if not os.path.exists(path) or not os.listdir(path): print(f"📥 下载模型: {name}") os.makedirs(path, exist_ok=True) snapshot_download(model_id=name, local_dir=path) else: print(f"✅ 模型已存在: {path}") # ====================== # 启动服务 # ====================== print("\n🚀 启动 LLM 服务 (端口 8000)...") llm_cmd = ( f"python -m vllm.entrypoints.openai.api_server " f"--model {LLM_DIR} " f"--host 0.0.0.0 --port 8000 " f"--dtype bfloat16" ) print("🚀 启动 VLM 服务 (端口 8001)...") vlm_cmd = ( f"python -m vllm.entrypoints.openai.api_server " f"--model {VLM_DIR} " f"--host 0.0.0.0 --port 8001 " f"--dtype bfloat16 " f"--trust-remote-code" # ⚠️ 关键参数! ) print("\n🌐 访问地址:") print(f" - LLM: http://localhost:8000/v1") print(f" - VLM: http://localhost:8001/v1") # 后台启动 VLM,前台运行 LLM os.system(f"nohup {vlm_cmd} > vlm.log 2>&1 &") os.system(llm_cmd)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1211091.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS PC 应用,真的只是“放大版 App”吗?

子玥酱 (掘金 / 知乎 / CSDN / 简书 同名) 大家好,我是 子玥酱,一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂,目前在某国企负责前端软件研发相关工作,主要聚…

为什么 HarmonyOS PC 应用离不开文档模型

子玥酱 (掘金 / 知乎 / CSDN / 简书 同名) 大家好,我是 子玥酱,一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂,目前在某国企负责前端软件研发相关工作,主要聚…

《速看秘籍2.0!AI应用架构师借助科研AI智能体,分析社会动态的秘籍大升级》

速看秘籍2.0!AI应用架构师借助科研AI智能体,分析社会动态的秘籍大升级 引言 痛点引入:社会动态分析的“老难题”与“新挑战” 作为AI应用架构师,你是否也曾面临这样的困境:想通过AI分析社会动态(比如舆情…

2026成都VR虚拟现实开发公司优质推荐榜

2026成都VR虚拟现实开发公司优质推荐榜行业背景与选型痛点剖析据《2026-2030年中国VR/AR行业发展白皮书》显示,2026年国内VR/AR市场规模突破800亿元,工业、文旅、教育等领域渗透率同比提升42%。 成都作为西南数字经济…

Docker Swarm:打造高效、可扩展的容器编排引擎,引领微服务新纪元(上) - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

学习进度 8

今天没接着死磕调参,转而去了解 CNN 的经典应用场景和轻量化模型。之前一直用 MNIST 手写数字数据集,今天试着跑了个简单的猫狗图片分类 demo,结果发现直接搬用 LeNet-5 的结构完全不行,准确率才 60% 出头,查了资…

小主机连接显示屏显示无信号,大致是突然就不能用了

小主机连接显示屏显示无信号,大致是突然就不能用了先插各种显示屏的线,再开机,又行了 猜测是插了数据传输的线小主机开机的时候才会传输信号。

2026绵阳评价高医美机构品牌推荐

2026绵阳评价高医美机构品牌推荐行业背景与筛选依据据《2026中国医美行业白皮书》显示,川西北地区医美市场年复合增长率达12.7%,绵阳作为区域核心城市,求美者对机构资质、本土审美适配性的关注度较全国平均水平高出…

实战指南:高效批量测试SSH连接的最佳实践与避坑手册

实战指南:高效批量测试SSH连接的最佳实践与避坑手册 引言:当自动化遇到现实挑战 在运维工作中,我们常常需要管理大量服务器。最近我遇到一个实际需求:需要快速测试一批服务器的SSH连接性,所有服务器都使用相同的root…

深度测评专科生必备!10款一键生成论文工具TOP10大对比

深度测评专科生必备!10款一键生成论文工具TOP10大对比 2026年专科生论文写作工具测评:为何需要这份榜单? 随着高校教育的不断深化,专科生在学术写作方面的需求日益增长。然而,面对繁重的课程任务和论文压力&#xff…

2026年绵阳医美机构最新推荐:绵阳做一次超声炮效果维持多久/绵阳做完祛眼袋多久能恢复/绵阳做祛眼袋大概多少钱/选择指南

2026年评价高的绵阳医美机构推荐一、行业背景与筛选依据据《2026中国医美行业白皮书》显示,川西北地区医美市场年增速达18.2%,抗衰、眼部整形、皮肤美容类项目占比超60%。 但市场中仍存在资质合规性不足、医师审美偏…

2026年深圳跨境电商财税合规与记账报税公司综合评测与推荐:深圳信质远企服聚焦核心运营,成为行业黑马

在金税四期全面落地、税务监管日益智能与严格的2026年,跨境电商企业面临的不再是“要不要合规”的问题,而是“如何高效、低成本实现深度合规”的挑战。据《2025中国跨境电商发展白皮书》显示,超63%的中小外贸企业仍…

导师严选9个AI论文写作软件,MBA论文高效搞定!

导师严选9个AI论文写作软件,MBA论文高效搞定! AI工具如何助力MBA论文写作? 在当今快节奏的学术环境中,MBA学生面临着繁重的论文写作任务。而AI工具的出现,为这一过程注入了新的活力。无论是降低AIGC率还是保持语义通顺…

2026年清洗机厂家推荐:医用清洗机/医用清洗机/医用超声波清洗机/医疗器械清洗机/半自动超声波清洗机/单槽超声波清洗机/选择指南

2026评价高的超声波清洗机公司推荐根据《2026-2030中国工业清洗设备行业发展白皮书》数据显示,国内工业清洗设备市场规模已突破320亿元,年复合增长率达8.2%,其中超声波清洗设备占比超45%,成为五金机械加工、汽车零…

警惕大润发购物卡回收陷阱

闲置的大润发购物卡成了不少人的“沉睡资源”,随着回收变现需求愈发旺盛,大润发购物卡回收市场却鱼龙混杂,各类陷阱层出不穷,持卡人一不小心就会遭受损失。 一、虚假高价诱饵,到手大打折扣 非正规平台常常抛出“9…

Linux 环境下利用宝塔 + Discuz + Cpolar 搭建全网可访问论坛

文章目录Linux 环境下利用宝塔 Discuz Cpolar 搭建全网可访问论坛一、搭建基础环境1. 安装 PHP 环境2. 安装数据库二、快速部署 Discuz三、安装 Cpolar 内网穿透工具1. 安装 Cpolar2. 配置 Token3. 添加系统服务与启动四、配置公网访问 Discuz五、绑定固定域名六、完成 Discu…

分布式光伏配电网非精确概率故障诊断【附代码】

✅ 博主简介:擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。 ✅成品或者定制,扫描文章底部微信二维码。 (1)非精确概率模型在光伏配电网故障诊断中的理论构建 随着分布式光伏发电系统在配…

ISO/IEC 23053:2022中文版

ISO/IEC 23053:2022中文版已完成,50页ISO/IEC 23053:2022是一部关于使用机器学习的人工智能系统的框架性国际标准,其第一版于2022年6月发布。该标准旨在为描述此类系统提供一个通用的、包含系统组件、功能与术语的框架,涵盖机器学习任务、模型…

深度学习框架YOLOV8模型如何训练无人机建筑垃圾检测数据集 建立基于深度学习框架YOLO8建筑垃圾检测系统 建筑废弃物

CDW materials 建筑废弃物材料数据集说明 数据集核心信息表项目详情类别数量及中文名称1 类(建筑废弃物材料)数据数量2200(图像总数),其中训练集 1500、验证集 400、测试集 200数据集格式种类YOLO 格式最重要的应用价值…

温暖治愈的简短故事清单:5个长篇童话,把今晚的不安轻轻放下

睡前故事从来不是孩子的专属。对很多成年人来说,“温暖治愈的简短故事”之所以会被反复搜索,背后其实是一个很现实的需求:用可预测、低刺激的叙事,帮助大脑从高唤醒状态慢慢降下来,更容易进入睡眠节律。叙事心理学里也…