【大模型应用开发】之本地部署大模型

news/2025/10/28 22:35:37/文章来源:https://www.cnblogs.com/tomMan/p/19172878

本地部署

  • 本地部署一般是在自己的服务器上部署,但这里以本地电脑进行部署为例,由于电脑配置远远无法支持大模型配置要求,届时部署下来的也是阉割版的。

  • 本地部署一种方案就是ollama,官方地址:https://ollama.com

  • 访问后点击下载,我这里是Windows版本(Linux可以直接通过指令下载)

  • image

  • 下载期间我们可以看一下ollama左上角的Models,可以看到各种模型,随便点击一个模型进入详情页,可以看到各种版本和大小,以及运行的指令,学过docker的同学一个很熟悉这些指令的语法,是的,跟docker类似。

    • 这里的b是billion,10亿的意思,故1.5b就是15亿,表示模型支持的参数数量,可以通过参数对模型进行微调。参数越多,模型推力分析能力越强。所以671b就是deepseek的满血版。
    • 我们的电脑部署得看显存,比如显存为6g,那1.5b,1.7b和1.8b都可以部署,以此类推。(通过ctrl+shift+esc打开任务管理器,点击性能,找到GPU 即可看到显存)
  • image

  • image

  • 下载后默认是安装在C盘的,若不想装在C盘,则需要用指令安装,我这里用指令安装到D盘。

    • 在OllamaSetup.exe所在目录打开cmd命令行,然后命令如下:

      OllamaSetup.exe /DIR=你要安装的目录位置

      image

  • 安装后,退出客户端(quit ollama),然后配置环境变量,设置ollama模型的存储路径

  • image

  • image

  • 完成后可以在浏览器访问 http://localhost:11434/,显示ollama正在运行

  • image

  • 也可以通过cmd输入 ollama --version验证是否安装成功

  • image

  • 配置后再ollama.exe的所在位置打开cmd

  • image

  • 接下来运行模型

    • 选择适合自己的模型即可,ollama会给出运行的命令
    • image
  • 这样就可以使用啦

  • image

  • 可以通过命令ollama --help查看命令的使用,跟docker语法还是挺像的

  • image

  • 关于开机自启

    • 访问一下路径,删除对应的Ollama.Ink文件
    • C:\Users\xxx\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup
      image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/949191.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

link元素的用法及HTML样板

本人学习时候很容易额外扩展,因为很多次见到同一个熟悉但不了解的代码或用法我会很难受,所以我把基本用法都列出来了,看起来会很冗杂(因为不仅不同文章重复,相同文章我也在重复-.-),但结合实例来回对比查阅让我…

Raft 一致性算法简介

引言与背景 分布式系统中,为了在 非拜占庭故障(如节点宕机或网络分区)情况下保持数据一致性,往往需要分布式共识算法来确保多个副本状态统一 。长期以来,Leslie Lamport 提出的 Paxos 算法 一直是这一领域的代表…

10月28号

今天上午进行了铁道认知实训

URL验证绕过速查表:全面解析SSRF与CORS绕过技术

本文详细介绍了PortSwigger最新发布的URL验证绕过速查表工具,涵盖域名混淆、伪相对URL、环回地址编码等核心技术,帮助安全测试人员快速生成绕过payload,有效检测SSRF、CORS配置错误等漏洞。介绍URL验证绕过速查表 U…

https://avoid.overfit.cn/post/44c8d547475340d59aa4480f634ea67f

现在的 Agent 系统有个很明显的问题 —— 会话一结束,什么都忘了。 这不是个技术缺陷,但是却限制了整个系统的能力边界。Agent 可以做推理、规划、执行复杂任务,但就是记不住之前发生过什么。每次对话都像是第一次见…

23题黄金分割

某同学在学习了黄金分割后对于黄金分割产生了浓厚的兴趣,于是他开始探究有关黄金分割的相关性质,请你帮助他完成以下任务。【任务一】作一个黄金分割 (1)如图, \(BC \perp AB\), \(BC = \frac{1}{2} AB\),作 \(…

记录一次成功的springboot2

pom文件<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"x…

算法学习-素数筛法【埃氏筛法、线性筛法】

普通筛法: 核心思路: 使用一个布尔数组记录此数是否为素数, 从2~n便利, 如果是此数记录为素数 向后维护数组,此素数的K倍均为非素数,直到大于n. ^时间复杂度O(nlogn) 便利+维护 埃式筛法 初式: 同线性筛法,依次遍历向后…

日总结 19

C#是基于.NET框架的托管语言,由CLR(公共语言运行时)负责自动内存管理(垃圾回收),开发效率高,更适合快速构建Windows应用、Web服务、Unity游戏等上层应用,编译后生成中间语言(IL),跨平台依赖.NET Core/5+;而…

Day 18

复习日:把散落的知识点,织成可落地的网 原本计划学新内容,可翻了翻最近的笔记,发现二叉树遍历、MySQL查询、离散图论的知识点像散落在抽屉里的零件——单独看都认识,凑到一起却不知道怎么联动。索性花一天时间复盘…

Jenkins Share Library教程 —— 企业级 Jenkins Shared Library 实战示例

写在前面 好久不见~最近状态稍缓,更新也慢了些,这篇文章同样让大家等了挺久,先跟大家说声抱歉。 如果你认真读了前面几篇,还跟着实践了,那到这里,咱们就要正式开启真正的 “进阶阶段” 啦! 确实,大多数公司内…

STM32之fromelf生成bin和反汇编文件

介绍一下STM32之fromelf生成bin和反汇编文件的命令。一、生成bin文件 fromelf --bin -o UWBStation.bin UWBStation/UWBStation.axf或者 fromelf --bin -o "@L.bin" "#L"二、生成反汇编文件 frome…

25.10.28联考题解

A 从两边贪心即可。 B 设 \(f_{i,j,0/1}\) 表示牌堆还剩 \(i\) 张牌,现在已经有 \(j\) 种有用的牌种,是否有对子的期望。转移考虑分讨新的牌是否有贡献,有什么贡献即可。 C 首先差分,现在一次操作就是一个位置加一…

2025年河南工业大学2025新生周赛(1)

A 诚信参赛 如果你答案错误,请检查:1. 是否是英语输入状态下的标点符号;2. 逗号后面有个空格。 写这类题时,建议直接复制题目需要输出的内容粘贴到代码里。 #include <stdio.h>int main(void) { printf(&…

excel查找满足条件的第二项

需求就是,查找满足条件的第二项 使用vlookup达不到,网上查的似乎都不行,实验后找到一个方法=VLOOKUP(E1,INDEX(A:B,MATCH(E1,A:A,0)+1,1):INDEX(A:B,MATCH("座",A:A ),2),2,0)稍微解释一下:思路是,用MA…

【传奇开心果系列】基于Flet框架实现的跷跷板动画自定义模板特色和实现原理深度解析 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

CF506E Mr. Kitayutas Gift

没见过的套路,还是很神的。模数写成 \(10^4+5\) 调了 1h /fn。 首先记 \(m=|S|+n\)。 计数考虑 dp。插入字符使其成为回文串 dp 显然是困困难难的。 考虑从最终插入字符后的结果入手,则对于回文串 \(T\) 能通过 \(S\…

记录一次成功的springBoot

开发您的第一个 Spring Boot 应用程序本节介绍如何开发一个小型的“Hello World!” Web 应用程序,该应用程序突出显示了 Spring Boot 的一些关键功能。 您可以选择 Maven 或 Gradle 作为构建系统。 spring.io 网站包…

2025.10.28总结

今天做了23年上半年软考下午题,整体来说,前四道题没那么难,需要熟悉题型看教程, 最后一道用c++/java的挖空填代码的题,没搞懂,可能是之前没做过或做的少,或者是对java,c++语法,忘的差不多了,那题一点思路也没…

代码大全2阅读笔记(1)

一、为什么《代码大全 2》值得反复读? 作为软件工程领域的 “圣经”,《代码大全 2》最颠覆我的认知是:编码的核心不是 “实现功能”,而是 “写出易理解、易维护、可扩展的高质量代码”。很多时候我们急于动手写代码…