基于ollama、llamafile部署的大模型使用

一、ollama方式

1.本地部署ollama

部署方式:见本地部署ollama博客内容

2.基于langchain使用

from langchain_ollama.chat_models import ChatOllama llm = ChatOllama( model="deepseek-r1:8b", # 与本地 ollama run 的模型名保持一致 base_url="http://ip:11434", # 默认端口 temperature=0.1, num_predict=2048 ) # 单轮调用示例 for chunk in llm.stream( "你好" ): print(chunk.content)

二、llamafile方式

1.本地部署

步骤(linux环境)

wget https://huggingface.co/FM-1976/Qwen2.5-1.6b-llamafile/resolve/main/QwenPortable.llamafile chmod +x QwenPortable.llamafile ./QwenPortable.llamafile

2.基于langchain使用

from langchain_openai import ChatOpenAI # 配置本地模型:核心就是指向 llamafile 的 OpenAI兼容接口 llm = ChatOpenAI( base_url="http://ip:8080/v1", # 本地llamafile的API地址,固定 api_key="not-needed", # 必填但无效,随便填即可,llamafile不需要鉴权 model_name="not-needed", # 模型名随便填,不影响调用,llamafile会忽略 temperature=0.7, # 回答随机性,0=严谨,1=发散 max_tokens=128 # 最大生成字数 ) # 方式1:简单单轮对话 result = llm.invoke("你好") print(result.content)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1164699.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

django-flask基于python的个人学习任务挑战系统 学习助手软件设计与实现

目录摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 基于Python的Django-Flask个人学习任务挑战系统旨在帮助用户高效管理学习任务,提升学习动力与效率。系统结…

面向工业场景的高效目标检测系统:基于BiFPN和注意力机制的YOLOv8架构优化及实现

文章目录 **面向工业场景的高效目标检测系统:基于BiFPN与注意力机制的YOLOv8架构优化与实现** **第一章:核心技术架构——双向特征金字塔与注意力协同** **第二章:项目环境配置与数据预处理** **第三章:改进模块完整实现** **第四章:完整网络架构配置** **第五章:优化训练…

django-flask基于python的公司销售订单管理系统的设计与实现

目录摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 随着信息技术的快速发展,企业销售订单管理系统的数字化和智能化成为提升运营效率的关键。基于Python的Dja…

明确每项关键决策中谁负责(Responsible)、谁批准(Accountable)、咨询谁(Consulted)、通知谁(Informed)

软件项目人员职责简化对照表:人员类别主要职责简述关键能力/角色定位项目管理人员(项目经理)制定项目计划、控制进度与成本、组建团队、协调资源、解决冲突、推动决策兼具技术理解力与管理能力,项目总协调人高级管理人员定义项目战…

踩坑三周,我终于把 Claude Code 和 Codex 塞进了浏览器— 一个让手机也能写代码的疯狂想法

「在地铁上用手机写代码」,这个念头最早是怎么蹦出来的,我已经记不清了。只记得那天加班到凌晨两点,拖着疲惫的身躯挤进末班地铁,手里还攥着一个没解决的 bug。要是这时候能掏出手机,让 AI 帮我把代码改了该多好&#…

一行隐藏文本可劫持AI系统——无需点击,无需恶意软件,仅凭文字

一行隐藏文本可劫持AI系统——无需点击,无需恶意软件,仅凭文字 英国NCSC警告该弱点可能永远无法完全修复——因为它与语言模型如何阅读文本紧密相连。 一位银行客户要求ChatGPT查询账户余额。这个人工智能返回了另外十七位客户的账户详情,并开…

django-flask基于python的关于流量业务的用户投诉管理系统

目录Django-Flask 流量业务用户投诉管理系统摘要关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!Django-Flask 流量业务用户投诉管理系统摘要 该系统基于 Python 的 Django 和 Flas…

django-flask基于python的管网隐患安全巡检系统

目录 Django-Flask 基于 Python 的管网隐患安全巡检系统摘要 关于博主开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! Django-Flask 基于 Python 的管网隐患安全巡检系统摘要 随着城市化进…

毕设实战:基于多尺度空洞注意力(MSDA)的YOLOv8改进与视觉识别优化

文章目录 毕设实战:基于多尺度空洞注意力(MSDA)的YOLOv8改进与视觉识别优化 一、技术背景与方案优势 二、环境搭建与依赖准备 2.1 虚拟环境配置 2.2 数据集准备 三、MSDA模块的代码实现 3.1 多尺度空洞注意力(MSDA)核心代码 3.2 嵌入MSDA到YOLOv8的Backbone 四、模型训练与…

BQB有几种认证方式?需要哪些资料?

BQB 认证:认证方式及所需资料(纯文本版)BQB 认证即蓝牙技术联盟(Bluetooth SIG)的蓝牙产品资格认证,是蓝牙产品合法使用蓝牙商标、接入蓝牙技术体系的全球必备认证,通过后产品将获得 QDID&#…

办理3C认证需要准备哪些资料?

办理 3C 认证(中国强制性产品认证)的资料分为通用基础资料(所有产品必备)、专项技术资料(按产品类型补充)、工厂质量体系文件(第三方认证模式必备)、特殊情况补充资料(如…

办理3C认证需要准备哪些资料?

办理 3C 认证(中国强制性产品认证)的资料分为通用基础资料(所有产品必备)、专项技术资料(按产品类型补充)、工厂质量体系文件(第三方认证模式必备)、特殊情况补充资料(如…

3c认证的相关内容介绍

3C 认证,全称中国强制性产品认证(China Compulsory Certification),是中国政府依据《中华人民共和国认证认可条例》《强制性产品认证管理规定》实施的法定强制性产品合格评定制度,自 2002 年正式实施,旨在保…

提示工程已死?上下文工程才是大模型开发的“黄金标准“,小白秒变AI大神!

几年前,包括一些顶尖的 AI 研究人员在内的许多人声称,提示工程(prompt engineering)很快就会消亡。 显然,他们大错特错。事实上,提示工程现在比以往任何时候都更加重要,其重要性甚至让它被重新…

短信为何在亚洲更 “吃香”?中美通信习惯差异的底层逻辑

为什么大多数亚洲国家手机短信的使用远比美国更加普遍?短信为何在亚洲更 “吃香”?中美通信习惯差异的底层逻辑大多数亚洲国家手机短信的使用远比美国更普遍,核心是通信成本、基础设施、社交文化、功能替代四大因素的差异,让短信在…

手把手教你用7款AI写论文工具,精准控率无压力操作指南

还在为开题报告无从下笔而焦虑?或是被导师的修改意见搞得晕头转向?又或者,面对查重和AI检测率感到束手无策?别担心,你不是一个人在战斗。随着AI技术的飞速发展,一系列强大的AI论文写作工具应运而生&#xf…

哪些类型的产品需要做 CCC 认证?

CCC 认证(中国强制性产品认证)的产品范围由国家市场监督管理总局、国家认监委动态调整,截至 2025 年 12 月,最新《强制性产品认证目录》涵盖16 大类核心产品,细分类别超过 100 种,均为与消费者人身安全、公…

openEuler + MindSpore 全栈部署实战

openEuler MindSpore 全栈部署实战:从国产操作系统到大模型推理当国产生态相遇,一场软件与硬件的深度协同优化正在悄然发生。还记得第一次成功在 openEuler 上跑通一个完整的 MindSpore 模型训练任务时,系统监控面板上平稳的CPU和内存曲线—…

基于VUE的摄影分享平台系统[VUE]-计算机毕业设计源码+LW文档

摘要:随着摄影文化的广泛传播和互联网技术的发展,摄影分享平台成为摄影爱好者交流和展示的重要场所。本文介绍基于VUE框架的摄影分享平台系统的设计与实现过程。通过需求分析明确系统功能,利用VUE及相关技术进行开发,实现用户管理…

【程序员必看】11种RAG技术让AI不再“胡说八道“,大模型开发从此告别幻觉,代码效率提升200%!

一、引言 随着人工智能的快速发展,检索增强生成(Retrieval-Augmented Generation,RAG)技术正在经历前所未有的演变。RAG技术通过将外部知识融入大型语言模型(LLM)的生成过程,极大地提高了AI系统…