【大模型应用开发】之本地部署大模型

news/2025/10/28 22:35:37/文章来源:https://www.cnblogs.com/tomMan/p/19172878

本地部署

本地部署一般是在自己的服务器上部署，但这里以本地电脑进行部署为例，由于电脑配置远远无法支持大模型配置要求，届时部署下来的也是阉割版的。
本地部署一种方案就是ollama，官方地址:https://ollama.com
访问后点击下载,我这里是Windows版本(Linux可以直接通过指令下载)
下载期间我们可以看一下ollama左上角的Models,可以看到各种模型,随便点击一个模型进入详情页,可以看到各种版本和大小,以及运行的指令,学过docker的同学一个很熟悉这些指令的语法,是的,跟docker类似。
- 这里的b是billion，10亿的意思，故1.5b就是15亿，表示模型支持的参数数量，可以通过参数对模型进行微调。参数越多，模型推力分析能力越强。所以671b就是deepseek的满血版。
- 我们的电脑部署得看显存，比如显存为6g，那1.5b，1.7b和1.8b都可以部署，以此类推。（通过ctrl+shift+esc打开任务管理器，点击性能，找到GPU 即可看到显存）
下载后默认是安装在C盘的，若不想装在C盘，则需要用指令安装，我这里用指令安装到D盘。
- 在OllamaSetup.exe所在目录打开cmd命令行，然后命令如下：
  
  OllamaSetup.exe /DIR=你要安装的目录位置
安装后,退出客户端(quit ollama),然后配置环境变量,设置ollama模型的存储路径
完成后可以在浏览器访问 http://localhost:11434/,显示ollama正在运行
也可以通过cmd输入 ollama --version验证是否安装成功
配置后再ollama.exe的所在位置打开cmd
接下来运行模型
- 选择适合自己的模型即可,ollama会给出运行的命令
这样就可以使用啦
可以通过命令ollama --help查看命令的使用,跟docker语法还是挺像的
关于开机自启
- 访问一下路径，删除对应的Ollama.Ink文件
- C:\Users\xxx\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/949191.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

link元素的用法及HTML样板

link元素的用法及HTML样板

本人学习时候很容易额外扩展，因为很多次见到同一个熟悉但不了解的代码或用法我会很难受，所以我把基本用法都列出来了，看起来会很冗杂（因为不仅不同文章重复，相同文章我也在重复-.-），但结合实例来回对比查阅让我…

阅读更多...

Raft 一致性算法简介

Raft 一致性算法简介

引言与背景分布式系统中，为了在非拜占庭故障（如节点宕机或网络分区）情况下保持数据一致性，往往需要分布式共识算法来确保多个副本状态统一。长期以来，Leslie Lamport 提出的 Paxos 算法一直是这一领域的代表…

阅读更多...

10月28号

10月28号

今天上午进行了铁道认知实训

阅读更多...

URL验证绕过速查表：全面解析SSRF与CORS绕过技术

URL验证绕过速查表：全面解析SSRF与CORS绕过技术

本文详细介绍了PortSwigger最新发布的URL验证绕过速查表工具，涵盖域名混淆、伪相对URL、环回地址编码等核心技术，帮助安全测试人员快速生成绕过payload，有效检测SSRF、CORS配置错误等漏洞。介绍URL验证绕过速查表 U…

阅读更多...

https://avoid.overfit.cn/post/44c8d547475340d59aa4480f634ea67f

https://avoid.overfit.cn/post/44c8d547475340d59aa4480f634ea67f

现在的 Agent 系统有个很明显的问题 —— 会话一结束，什么都忘了。这不是个技术缺陷，但是却限制了整个系统的能力边界。Agent 可以做推理、规划、执行复杂任务，但就是记不住之前发生过什么。每次对话都像是第一次见…

阅读更多...

23题黄金分割

23题黄金分割

某同学在学习了黄金分割后对于黄金分割产生了浓厚的兴趣，于是他开始探究有关黄金分割的相关性质，请你帮助他完成以下任务。【任务一】作一个黄金分割（1）如图， \(BC \perp AB\)， \(BC = \frac{1}{2} AB\)，作 \(…

阅读更多...

记录一次成功的springboot2

记录一次成功的springboot2

pom文件<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"x…

阅读更多...

算法学习-素数筛法【埃氏筛法、线性筛法】

算法学习-素数筛法【埃氏筛法、线性筛法】

普通筛法: 核心思路: 使用一个布尔数组记录此数是否为素数, 从2~n便利, 如果是此数记录为素数向后维护数组,此素数的K倍均为非素数,直到大于n. ^时间复杂度O(nlogn) 便利+维护埃式筛法初式: 同线性筛法,依次遍历向后…

阅读更多...

日总结 19

日总结 19

C#是基于.NET框架的托管语言，由CLR（公共语言运行时）负责自动内存管理（垃圾回收），开发效率高，更适合快速构建Windows应用、Web服务、Unity游戏等上层应用，编译后生成中间语言（IL），跨平台依赖.NET Core/5+；而…

阅读更多...

Day 18

Day 18

复习日：把散落的知识点，织成可落地的网原本计划学新内容，可翻了翻最近的笔记，发现二叉树遍历、MySQL查询、离散图论的知识点像散落在抽屉里的零件——单独看都认识，凑到一起却不知道怎么联动。索性花一天时间复盘…

阅读更多...

Jenkins Share Library教程 —— 企业级 Jenkins Shared Library 实战示例

Jenkins Share Library教程 —— 企业级 Jenkins Shared Library 实战示例

写在前面好久不见～最近状态稍缓，更新也慢了些，这篇文章同样让大家等了挺久，先跟大家说声抱歉。如果你认真读了前面几篇，还跟着实践了，那到这里，咱们就要正式开启真正的 “进阶阶段” 啦！确实，大多数公司内…

阅读更多...

STM32之fromelf生成bin和反汇编文件

STM32之fromelf生成bin和反汇编文件

介绍一下STM32之fromelf生成bin和反汇编文件的命令。一、生成bin文件 fromelf --bin -o UWBStation.bin UWBStation/UWBStation.axf或者 fromelf --bin -o "@L.bin" "#L"二、生成反汇编文件 frome…

阅读更多...

25.10.28联考题解

25.10.28联考题解

A 从两边贪心即可。 B 设 \(f_{i,j,0/1}\) 表示牌堆还剩 \(i\) 张牌，现在已经有 \(j\) 种有用的牌种，是否有对子的期望。转移考虑分讨新的牌是否有贡献，有什么贡献即可。 C 首先差分，现在一次操作就是一个位置加一…

阅读更多...

2025年河南工业大学2025新生周赛（1）

2025年河南工业大学2025新生周赛（1）

A 诚信参赛如果你答案错误，请检查：1. 是否是英语输入状态下的标点符号；2. 逗号后面有个空格。写这类题时，建议直接复制题目需要输出的内容粘贴到代码里。 #include <stdio.h>int main(void) { printf(&…

阅读更多...

excel查找满足条件的第二项

excel查找满足条件的第二项

需求就是，查找满足条件的第二项使用vlookup达不到，网上查的似乎都不行，实验后找到一个方法=VLOOKUP(E1,INDEX(A:B,MATCH(E1,A:A,0)+1,1):INDEX(A:B,MATCH("座",A:A ),2),2,0)稍微解释一下：思路是，用MA…

阅读更多...

【传奇开心果系列】基于Flet框架实现的跷跷板动画自定义模板特色和实现原理深度解析 - 指南

【传奇开心果系列】基于Flet框架实现的跷跷板动画自定义模板特色和实现原理深度解析 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

阅读更多...

CF506E Mr. Kitayutas Gift

CF506E Mr. Kitayutas Gift

没见过的套路，还是很神的。模数写成 \(10^4+5\) 调了 1h /fn。首先记 \(m=|S|+n\)。计数考虑 dp。插入字符使其成为回文串 dp 显然是困困难难的。考虑从最终插入字符后的结果入手，则对于回文串 \(T\) 能通过 \(S\…

阅读更多...

记录一次成功的springBoot

记录一次成功的springBoot

开发您的第一个 Spring Boot 应用程序本节介绍如何开发一个小型的“Hello World！” Web 应用程序，该应用程序突出显示了 Spring Boot 的一些关键功能。您可以选择 Maven 或 Gradle 作为构建系统。 spring.io 网站包…

阅读更多...

2025.10.28总结

2025.10.28总结

今天做了23年上半年软考下午题，整体来说，前四道题没那么难，需要熟悉题型看教程，最后一道用c++/java的挖空填代码的题，没搞懂，可能是之前没做过或做的少，或者是对java，c++语法，忘的差不多了，那题一点思路也没…

阅读更多...

代码大全2阅读笔记（1）

代码大全2阅读笔记（1）

一、为什么《代码大全 2》值得反复读？作为软件工程领域的 “圣经”，《代码大全 2》最颠覆我的认知是：编码的核心不是 “实现功能”，而是 “写出易理解、易维护、可扩展的高质量代码”。很多时候我们急于动手写代码…

阅读更多...

最新文章