xinference推理embedding等小模型

news/2025/9/29 17:30:44/文章来源:https://www.cnblogs.com/mar/p/19119175

  embedding、rerank模型不少,需要一个框架来集中管理,选用了xinference,使用简单。采取容器化部署:

1、镜像下载:原始模型下载慢,采用渡渡鸟,下载

2、容器运行:

docker run -itd --name xinference --restart=always --name=xinference \
-v /home/app/models:/root/.xinference/cache/ \ # 把本地模型映射到容器,不用再从魔塔等处下载。如果本地没有,则从魔塔下载,并在此目录做链接指向容器内的缓存目录下
-v /home/app/xinference:/opt/xinference -e XINFERENCE_ENV_HOME_PATH=/opt/xinference \ # 指定inference的主目录,暂时未明白用途
-e XINFERENCE_MODEL_SRC=modelscope \ # 指定模型的默认下载位置为魔塔,下载后的模型会保存在容器的~/.cache/modelscope/hub/AI-ModelScope目录
-e HTTP_PROXY=http://192.168.152.249:3128 -e HTTPS_PROXY=http://192.168.152.249:3128 -e NO_PROXY=192.0.0.1/8,localhost,127.0.0.1 \ # 如果在内网需要下载模型。。。
-p 9997:9997 \
--gpus all \ # 使用所有的gpu
swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/xprobe/xinference:v1.6.1 \ # 来自渡渡鸟的镜像
xinference-local -H 0.0.0.0 \
--auth-config /opt/xinference/auth.json #启用鉴权,避免ui配置界面裸奔

  鉴权信息配置文件:

# auth.json
{"auth_config": {"algorithm": "HS256","secret_key": "09d25e094faa6ca2556c818166b7a9563b93f7099ff6fbf4caa6cf63b88e8d3e7","token_expire_in_minutes": 30},"user_config": [{"username": "admin","password": "1qaz2wsx121","permissions": ["admin"],"api_keys": ["sk-72tkvudyGLPMi","sk-Z0TLIY4gt9w11"]},{"username": "test","password": "1qaz2wsx121","permissions": ["models:list","models:read"],"api_keys": ["sk-35tkasdyGLYMy","sk-ALTbg16ut981w"]}]
}

3、模型加载:容器启动后到http://ip:9997下进行配置,启动需要的模型,如无特殊要求,直接点击小火箭。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/922057.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day15-项目上线

今日内容 1 项目上线架构# 1 购买云服务---操作系统--》centos9-上线到公网 # 2 nginx-转发用户的请求--》到uwsgi的django项目# 3 mysql8-后端项目数据存储在mysql中# 4 上传我们后端项目-导入项目依赖:requirements…

Docker入门 - 实践

Docker入门 - 实践2025-09-29 17:19 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-fam…

长沙百度推广公司电话太原seo关键词排名优化

了解哪一种 for 循环或迭代器适合我们的需求,防止我们犯下一些影响应用性能的低级错误。 由 Artem Sapegin 上传至 Unsplash JavaScript 是 Web 开发领域的“常青树”。无论是 JavaScript 框架(如 Node.js、React、Angular、Vue 等)&#x…

个人做美食视频网站wordpress自定义字段插件

本文实例讲述了Python使用matplotlib绘图无法显示中文问题的解决方法。分享给大家供大家参考,具体如下: 在python中,默认情况下是无法显示中文的,如下代码: import matplotlib.pyplot as plt # 定义文本框和箭头格式 d…

自己怎么做企业网站烟台主流网站

前言最近看了某客时间的《Java业务开发常见错误100例》,再结合平时踩的一些代码坑,写写总结,希望对大家有帮助,感谢阅读~1. 六类典型空指针问题包装类型的空指针问题级联调用的空指针问题Equals方法左边的空指针问题ConcurrentHas…

网站内页上海机械网站建设

完整课程请点击以下链接 Go 语言项目开发实战_Go_实战_项目开发_孔令飞_Commit 规范_最佳实践_企业应用代码-极客时间 Go语言中没有传统意义上的类和继承的概念,但可以通过嵌入类型(embedded types)来实现类似的功能。嵌入类型允许一个结构…

程序员用什么软件亚马逊seo什么意思

1. 什么是HTTP协议 HTTP是应用层的协议。Java最主要的应用场景是做网站,而网站由 后端(HTTP服务器) 和 前端(浏览器)组成,HTTP协议就是负责这里后端和前端的数据交互。 HTTP3.0 之前在传输层是通过 TCP传…

opencv学习记录6

图像金字塔图像金字塔 高斯金字塔 向下取样----pyrDown (1)对图像进行高斯卷积核 (2)删除所有偶数行和列其中,高斯核卷积运算(高斯滤波)就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的…

努力的轨迹,通往成长的旅程——赵欣彤的自我介绍

老师、助教和各位同学们您好,我是赵欣彤。这篇博客是想和您做一个简单的自我介绍。虽然还不够成熟和优秀,但我很愿意学习、改进,也希望在课程中积极参与团队合作和项目实践。期待能在您的指导下和同学们一起成长。�…

第2章 day02 requests基础

爬虫初始 爬虫相关介绍什么是爬虫?爬虫程序是需要充当B/S或者C/S架构中的客户端。 爬虫程序需要模拟客户端进行请求发送,然后获取服务器端对应的相关数据。 在B/S架构中爬虫程序模拟的就是浏览器。提问:如果日后你的…

WebAPI开发步骤

WebAPI开发步骤1.在VS2022中选择新建项目,选择 ASP.Net Core Web API.2.我们先用CodeFirst,即先建数据表模型,再用EF Core写入数据库定义User类,在新建文件夹Models下,里面可以建多个对应数据库中的表实体 在NuGet…

台州公司网站外包晋州建设规划局网站

一 insert 语句 强调: 本文介绍的内容很基础,仅做记录用,参考价值较少 ① 总述 目的: 增加rows记录1、完整格式insert [into] 表名[字段名1[, 字段名2]] value[s](值1, 值2);备注:指定部分字段添加,没有被指定的字段要么会自动增长,要…

线性代数_工程实践-计算实现numpy

点云和坐标变换数学概念 1.矩阵乘法01.两个矩阵A和B相乘,需要满足A的列数等于B的行数02.单位矩阵 如果A是nn矩阵,I是单位矩阵,则AI= A, IA = A03.逆矩阵 矩阵A的逆矩阵 A^-1, A A^-1=A^-1A= I,I是单位矩阵 当…

广州网站定制开发定制美瞳网站建设

之前为了做控规,从湘源8中扒了一套国空用地用海的绘图参数给湘源7使用。 【预告】在湘源控规7中使用 国空用地用海分类标准 但是部里在2023年11月又发布了一套新的用地用海分类。 本想去湘源8里面再扒一下,结果发现湘源8自己还没有更新呢,…

在HAL库使用printf打印串口信息

以STM32F103为例,在hal库中选择usart1,设置按下图配置并在usart.c文件内新增以下函数:点击查看代码 #if 1 #pragma import(__use_no_semihosting) //标准库需要的支持函数 struct __…

第3章 day03 xpath+反爬虫

上次直播作业下厨房的菜谱搜索(多个请求参数)通过抓包工具的分析发现,搜索菜谱的数据包有两个请求参数:keyword:搜索的关键字 cat:1001固定形式import requests#请求头 headers = {User-Agent:Mozilla/5.0 (Macint…

装修公司营销网站模板查询注册公司

正整数 A 的“D​A​​(为 1 位整数)部分”定义为由 A 中所有 D​A​​ 组成的新整数 P​A​​。例如:给定 A3862767,D​A​​6,则 A 的“6 部分”P​A​​ 是 66,因为 A 中有 2 个 6。 现给定 A、D​A​​…

ttkefu2026迎来永久免费的客服系统分享

ttkefu2026迎来永久免费的客服系统分享在数字化浪潮席卷全球的当下,客户服务已成为企业核心竞争力的重要组成部分。然而,传统客服系统高昂的部署成本、复杂的功能配置以及多渠道整合的痛点,始终制约着中小企业服务效…

002- 学习环境搭建

学习环境搭建1、开发工具下载 Visualstudio 2022  https://visualstugio.microsoft.com/zh-hans/vs/ 【产品链接,失效自己找和谐版本】  https://docs.microsoft.com/zh-cn/visualstudio/releases/2022/system…

网页建站点seo实战密码在线阅读

最近看到一道面试题:内部类可以引用它的包含类的成员吗?有没有什么限制? 答案大部分都是这样子的: 完全可以。如果不是静态内部类,那没有什么限制! 一个内部类对象可以访问创建它的外部类对象的成员包括私有…