本地AI大模型工具箱 Your local AI toolkit:LMStudio

LMStudio介绍

官网:LM Studio - Discover, download, and run local LLMs

LMStudio 是一个面向机器学习和自然语言处理的,旨在使开发者更容易构建和部署AI语言模型的应用软件。

LMStudio的特点是:

完全本地离线运行AI大模型

可以从Huggingface查找下载最新的大模型

为本地应用提供AI模型调用

对话可以附带本地pdf、docx等文档

跟Ollama的不同

基本感觉LMStudio跟Ollama类似,都可以提供本地运行大模型,本地API调用等功能。但是Ollama更专注于开箱即用,为其它应用使用大模型提供大模型API调用,软件界面比较简单,Ollama本身只提供了命令行形式的chat。

LMStudio 提供了集成开发环境,下载模型和chat对话等都可以通过点击鼠标实现,对新手更友好。

另外Ollama构建了自己的模型库(网站),LMStudio则是使用huggingface模型库(资源)。因此LMStudio支持的模型更多,而Ollama则使用起来更快捷。

第一次接触它的时候,因为没有科学上网,发现完全不能用,就放弃了它。

后来,是因为在各种AI软件的API提供者配置中,大部分都有“LMStudio”大模型服务商这个设置,证明它还是比较流行的。

实践

从官网下载安装包:LM Studio - Discover, download, and run local LLMs

windows、Linux、MacOS等系统下都有安装包,直接下载安装即可。

启动配置

常用的三个快捷键:

Ctrl+Shift+M寻找模型

Ctrl+Shift+R 设置运行架构

Ctrl+Shift+H 查看当前硬件

LMStudio运行架构最低需求是CPU+AVX2 ,跟Ollama的要求一样,但其实Ollma是可以在CPU+AVX架构下运行deepseek-r1的1.5b和7b模型的。

搜寻模型

准备加载模型,先按Ctrl+Shift+M到Huggingface寻找模型。 

如果没有科学上网,到了这步就会卡住,这也是LMStudio这个优秀软件为什么我以前接触了一下就没再使用的原因,当时发现无法下载模型,这个软件就是一个空壳子,啥也干不了。

手动下载模型安装

使用transformers手动下载模型,比如

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretrained("HuggingFaceTB/SmolLM2-135M")
model = AutoModelForCausalLM.from_pretrained("HuggingFaceTB/SmolLM2-135M")

模型下载到C:\Users\<YourUsername>\.cache\huggingface\hub 目录下。

在LMStudio “我的模型”配置页面,将模型目录设置为transformers的下载目录,即可看到当前系统的模型:

但是在chat界面选择这几个模型,都无法加载,报错:

No LM Runtime found for model format 'onnx'! 

No LM Runtime found for model format 'torchSafetensors'!

按照提示的,pip安装了torchSafetensors

pip install safetensors

问题还是没有解决

尝试转换格式(失败)

使用如下命令可以转格式,但是不会转配置文件啊 

import torch
from safetensors.torch import load_file, save_filedef safetensors_to_bin(safetensors_path, bin_output_path):# 加载Safetensors格式的模型权重weights = load_file(safetensors_path)# 将模型权重转换为PyTorch张量,并保存为.bin格式state_dict = {k: v.clone().cpu() for k, v in weights.items()}torch.save(state_dict, bin_output_path)# 示例用法
safetensors_to_bin('model.safetensors', 'model_converted.bin')

比如源文件位置设为inputx: 

inputx = "C:\\Users\\Admin\\.cache\\huggingface\\hub\\models--HuggingFaceTB--SmolLM2-135M\\snapshots\\93efa2f097d58c2a74874c7e644dbc9b0cee75a2\\model.safetensors"

safetensors_to_bin(inputx, 'model_converted.bin') 

转换之后,发现没有那些配置文件啊

把ollama的整个模型存储目录暴露给LMStudio,加载模式还是报错:

No LM Runtime found for model format 'gguf'!

估计真正的问题,是cpu只支持avx,不支持avx2导致的。也就是架构不支持,Not Compatible的问题。

暂时搁置。

添加国内Huggingface镜像

发现LMStudio不能到Huggingface下载模型,整个软件都失去了使用意义。于是决定换镜像,也就是把huggingface.co 替换为国内镜像站 hf-mirror.com

以Windows下为例,到LMStudio的安装目录,比如:E:\Program Files\LM Studio\resources\app 目录下,搜索包含hugg字符的文件,搜索到index.js和main_window.js两个文件:

点开编辑这两个文件,在文件中查找huggingface.co字符,替换成hf-mirror.com 。

index.js文件中有9处替换,main_window.js中有113处替换。 

替换完毕,重新启动LMStudio软件。

测试下载失败,可能是硬件不符合要求,导致找不到可以下载的模型。

最简单的解决方案

在LMStudio的设置中,可以勾选:

Use LM Studio's Hugging Face Proxy

据说这是专为上不去HuggingFace的人专设的,大家可以去试试。

我这边没有改观,可能是硬件不符合要求导致。

总结

LMStudio 是一个非常不错的用于在本地计算机开发和实验LLM大模型,并可以同时提供LLM API调用服务的桌面程序。就像普通的Windows程序一样非常易于使用。

但是如果不能科学上网的话,它的易用性就大打折扣了。但是官方也注意到这件事,所以大家可以试试最简单的那个解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/74125.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[OpenCV】相机标定之棋盘格角点检测与绘制

在OpenCV中&#xff0c;棋盘格角点检测与绘制是一个常见的任务&#xff0c;通常用于相机标定。 棋盘格自定义可参考: OpenCV: Create calibration pattern 目录 1. 棋盘格角点检测 findChessboardCorners()2. 棋盘格角点绘制 drawChessboardCorners()3. 代码示例C版本python版本…

redis的典型应用 --缓存

Redis最主要的用途&#xff0c;分为三个方面&#xff1a; 1.存储数据&#xff08;内存数据库&#xff09; 2.缓存&#xff08;最常用&#xff09; 3.消息队列 缓存 (cache) 是计算机中的⼀个经典的概念。核⼼思路就是把⼀些常⽤的数据放到触⼿可及(访问速度更快)的地⽅&…

本地基于Ollama部署的DeepSeek详细接口文档说明

前文&#xff0c;我们已经在本地基于Ollama部署好了DeepSeek大模型&#xff0c;并且已经告知过如何查看本地的API。为了避免网络安全问题&#xff0c;我们希望已经在本地调优的模型&#xff0c;能够嵌入到在本地的其他应用程序中&#xff0c;发挥本地DeepSeek的作用。因此需要知…

基于ArcGIS和ETOPO-2022 DEM数据分层绘制全球海陆分布

第〇部分 前言 一幅带有地理空间参考、且包含海陆分布的DEM图像在研究区的绘制中非常常见&#xff0c;本文将实现以下图像的绘制 关键步骤&#xff1a; &#xff08;1&#xff09;NOAA-NCEI官方下载最新的ETOPO-2022 DEM数据 &#xff08;2&#xff09;在ArcGIS&#xff08;…

自动化测试框架pytest+requests+allure

Pytest requests Allure 这个框架基于python的的 Pytest 进行测试执行&#xff0c;并结合 Allure插件 生成测试报告的测试框架。采用 关键字驱动 方式&#xff0c;使测试用例更加清晰、模块化&#xff0c;同时支持 YAML 文件来管理测试用例&#xff0c;方便维护和扩展。 测试…

Retrofit中scalars转换html为字符串

简介 在Retrofit中&#xff0c;如果你想直接获取HTML或其他文本格式的响应内容而不是将其映射到一个模型类&#xff0c;ScalarsConverterFactory 就派上用场了。ScalarsConverterFactory 是一个转换器工厂&#xff0c;它能够将响应体转换为Java基本类型如String、Integer或Byte…

Powershell WSL Windows系统复制数据到ubuntu子系统系统

从本地D盘下拷贝数据到ubuntu子系统下 Powershell 管理员打开执行 /mnt/d 此处是本地Windows系统的路径表示/opt ubutu 子系统目录 wsl -d Ubuntu-22.04 -u root -- bash -c cp -rf /mnt/d/nginx.conf /opt/从ubuntu子系统中拷贝数据到本地D盘下 Powershell 管理员打开执行…

【多线程】线程安全集合类,ConcurrentHashMap实现原理

文章目录 线程安全集合类解决方案多线程环境使用顺序表多线程环境使用队列多线程环境使用哈希表ConcurrentHashMap1. 缩小锁的粒度2. 充分使用 CAS3. 针对扩容操作 线程安全集合类 ArrayList、Queue、HsahMap… 都是线程不安全的 Vector、Stack、Hashtable 都是线程安全的&am…

spring-tx笔记

编程式事务与声明式事务的理解 补充&#xff1a;什么是事务&#xff1f; 事务是一个重要概念&#xff0c;尤其在数据库管理系统中。事务是指一组操作。&#xff0c;这些操作要么全部成功执行&#xff0c;要么全部不执行&#xff0c;确保数据的一致性和完整性 编程式事务 编…

Android第四次面试(Java基础篇)

一、Java 中的 DCL 单例模式 单例模式是设计模式中最常用的模式之一&#xff0c;其核心目标是确保一个类在程序中仅有一个实例&#xff0c;并提供全局访问点。在 Java 中&#xff0c;实现单例模式需要兼顾线程安全和性能优化。DCL&#xff08;Double-Checked Locking&#xff0…

Java-SpringBootWeb入门、Spring官方脚手架连接不上解决方法

一. Spring 官网&#xff1a;Spring | Home Spring发展到今天已经形成了一种开发生态圈&#xff0c;Spring提供了若干个子项目&#xff0c;每个项目用于完成特定的功能(Spring全家桶) Spring Boot可以帮助我们非常快速的构建应用程序、简化开发、提高效率 。 二. Spring Boot入…

1.7 无穷小的比较

1.定义 2.性质 3.无穷小的比较 3.1等价无穷小的性质 3.2 常见等价无穷小

StarRocks 升级注意事项

前段时间升级了生产环境的 StarRocks&#xff0c;从 3.3.3 升级到了 3.3.9&#xff0c;期间还是踩了不少坑所以在这里记录下。 因为我们的集群使用的是存算分离的版本&#xff0c;也是使用官方提供的 operator 部署在 kubernetes 里的&#xff0c;所以没法按照官方的流程进入虚…

深入探究 JVM 堆的垃圾回收机制(一)— 判活

垃圾回收分为两步&#xff1a;1&#xff09;判定对象是否存活。2&#xff09;将“消亡”的对象进行内存回收。 1 判定对象存活 可达性分析算法&#xff1a;通过一系列“GC Roots”对象作为起始节点集&#xff0c;从这些节点开始&#xff0c;根据引用关系向下搜索&#xff0c;…

国产开发板—米尔全志T113-i如何实现ARM+RISC-V+DSP协同计算?

近年来&#xff0c;随着半导体产业的快速发展和技术的不断迭代&#xff0c;物联网设备种类繁多&#xff08;如智能家居、工业传感器&#xff09;&#xff0c;对算力、功耗、实时性要求差异大&#xff0c;单一架构无法满足所有需求。因此米尔推出MYD-YT113i开发板&#xff08;基…

Tomcat虚拟主机配置详解:Centos环境下多域名部署(详细教程!)

&#x1f3e1;作者主页&#xff1a;点击&#xff01; Tomcat服务器&#x1f4dd;专栏&#xff1a;点击&#xff01; &#x1f427;Linux高级管理防护和群集专栏&#xff1a;点击&#xff01; ⏰️创作时间&#xff1a;2025年3月18日14点14分 最近在折腾 Tomcat 的时候&…

鸿蒙开发工程师简历项目撰写全攻略

一、项目结构的黄金法则 建议采用「41」结构&#xff1a; 项目背景&#xff08;业务价值&#xff09;技术架构&#xff08;鸿蒙特性&#xff09;核心实现&#xff08;技术难点&#xff09;个人贡献&#xff08;量化成果&#xff09;附加价值&#xff08;延伸影响&#xff09; …

dfs刷题排列问题 + 子集问题 + 组和问题总结

文章目录 一、排列问题全排列II题解代码 优美的排列题解代码 二、子集问题字母大小写全排列题解代码 找出所有子集的异或总和再求和题解代码 三、组合问题电话号码的字母组合题解代码 括号生成题解代码 组合题解代码 目标和题解代码 组合总和题解代码 总结 一、排列问题 全排列…

【Linux】VMware17 安装 Ubuntu24.04 虚拟机

目录 安装教程 一、下载 Ubuntu 桌面版iso映像 二、安装 VMware 三、安装 Ubuntu 桌面版 VMware 创建虚拟机 挂载 Ubuntu ISO 安装 Ubuntu 系统 安装教程 一、下载 Ubuntu 桌面版iso映像 链接来自 清华大学开源软件镜像站 ISO文件地址&#xff1a;ubuntu-24.04.2-des…

CVPR2025 | 对抗样本智能安全方向论文汇总 | 持续更新中~

汇总结果来源&#xff1a;CVPR 2025 Accepted Papers 若文中出现的 论文链接 和 GitHub链接 点不开&#xff0c;则说明还未公布&#xff0c;在公布后笔者会及时添加. 若笔者未及时添加&#xff0c;欢迎读者告知. 文章根据题目关键词搜索&#xff0c;可能会有遗漏. 若笔者出现…