OpenShift AI - 模型注册管理

《OpenShift / RHEL / DevSecOps 汇总目录》
说明:本文已经在 OpenShift 4.18 + OpenShift AI 2.19 的环境中验证

文章目录

  • 启用模型注册管理功能
    • 安装管理数据库
    • 启用模型注册功能
  • 注册模型
  • 部署模型
  • 归档模型
    • 归档模型和模型版本
    • 恢复归档模型
  • 模型注册表访问权限管理
  • 参考

启用模型注册管理功能

安装管理数据库

可以使用 MySQL 或 MariaDB 做为 OpenShift AI 模型管理的数据库。

  1. 创建项目
$ oc new-project mysql
  1. 在 OpenShift 的开发者视图中添加菜单,然后在开发者目录中选择Databases,最后点击下图的MariaDB
    在这里插入图片描述
  2. 在右划页面中点击实例化模板按钮,然后在 Instantiate Template 页面中根据以下配置创建环境:
    Database Service Name: modelregistry
    MariaDB Connection Username:modelregistry
    MariaDB Connection Password:password
    MariaDB root Password:password
    MariaDB Database Name:modelregistry
    Volume Capacity:5GB

启用模型注册功能

  1. 编辑 OpenShift AI Operator 中的 DataScienceCluster 对象,将 modelregistry.managementState 改为 Managed。
    modelregistry:managementState: ManagedregistriesNamespace: rhoai-model-registries
  1. 查看 redhat-ods-applications 项目的拓扑试图,确认会新出现一个名为 default-modelregistry 的 ModelRegistry 对象。该对象是一个 Controller,它会在 rhoai-model-registries 项目中管理实际的模型注册表运行环境。
$ oc get pod -n rhoai-model-registries
NAME                             READY   STATUS    RESTARTS   AGE
modelregistry-75d8f6bbdb-27n8f   3/3     Running   0          28h
  1. 在配置生效后可以在 OpenShift AI 控制台中看到新的 Settings -> Model registry settings 菜单。
  2. 进入 Settings -> Model registry settings 菜单,然后点击 Create model registry 按钮,再根据以下配置添加一个 Model registry。
    Name: modelregistry
    Host: modelregistry.mysql.svc.cluster.local
    Port: 3306
    Username: modelregistry
    Password: password
    Database: modelregistry
  3. 完成后可以看到 Model registry 的状态,并且在 Models 下出现新的 Model registry 菜单。
    在这里插入图片描述

注册模型

在注册一个模型前先要把该模型的相关文件下载到 OpenShift 能够访问的 S3 对象存储中。本节点已经根据《OpenShift AI - 在 OpenShift 和 OpenShift AI 上运行 LLM》一文将 huggingface 的 mistralai/Mistral-7B-Instruct-v0.2 模型传到 MinIO 对象存储中了。

  1. 进入 OpenShift AI 控制台的 Models -> Model registry 菜单。
  2. 点击 Registry model 按钮,然后根据以下配置注册一个模型。
    Model name: Mistral-7B-Instruct
    Version name: v0.2
    Object storage
    Endpoint: http://minio-service.minio.svc.cluster.local:9000
    Bucket: models
    Region: none
    Path: models/Mistral-7B-Instruct-v0.2
  3. 完成后可查看已注册的模型以及包含的版本。
    在这里插入图片描述
    在这里插入图片描述

部署模型

  1. 进入 Data science projects 菜单,然后新建一个名为 my-mistral-7 的项目。
  2. 为了能够在项目中部署运行模型,需要先确定使用的模型运行模式。切换到 my-mistral-7 项目的 Models 页面,然后点击下图的 Select single-model 按钮。
    在这里插入图片描述
  3. 返回到 Model registry 菜单,进入 modelregistry 的 Mistral-7B-Instruct 模型,然后在版本为 v0.2 一行右侧的下拉菜单中选中 “Deploy”。
    在这里插入图片描述
  4. 在 Deploy model 对话框中,最后点击 Deploy。
    在这里插入图片描述
  5. 在部署好模型后,可以在该版本的模型中看到关联的部署情况。注意:该列表只显示通过 Model registry 进行部署的情况。
    在这里插入图片描述

归档模型

被归档的模型或模型版本缺省时不能在 Model registry 中显示出来的,而只能在归档中显示。另外,用户也无法部署一个已经归档的模型。

归档模型和模型版本

  1. 通过 Archive model 下拉菜单可以对整个模型进行归档。
    在这里插入图片描述
  2. 通过 Archive model version 下拉菜单可以对一个模型的某个版本进行归档。
    在这里插入图片描述

恢复归档模型

  1. 通过 View archived models 或者 View archived versions 菜单可以显示被归档的模型或模型版本。
    在这里插入图片描述
  2. 在选择 Restore model 或 Restore model version 菜单后可将归档的模型或模型版本重新恢复到正常状态。
    在这里插入图片描述

模型注册表访问权限管理

在 OpenShift AI 控制台中,一个模型注册表需要管理员授权后才能被普通用户访问到。

  1. 用一个普通用户登录 OpenShift AI 控制台,确认缺省在 Model Registry 中看不到已有的模型注册表。
    在这里插入图片描述
  2. 用管理员进入 OpenShift AI 控制台的 Model registry settings,然后进入一个 Model registry,再将普通用户添加到 Users 中。
    在这里插入图片描述
  3. 确认普通用户可以在 Model Registry 中看到并使用被授权的模型注册表了。

参考

https://docs.redhat.com/en/documentation/red_hat_openshift_ai_self-managed/2.19/html-single/managing_model_registries/index#overview-of-model-registries_managing-model-registries

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/79801.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【背包dp----01背包】例题三------(标准的01背包+变种01背包1【恰好装满背包体积 产生的 最大价值】)

【模板】01背包 题目链接 题目描述 : 输入描述: 输出描述: 示例1 输入 3 5 2 10 4 5 1 4输出 14 9说明 装第一个和第三个物品时总价值最大,但是装第二个和第三个物品可以使得背包恰好装满且总价值最大。 示例2 输入 3 8 12 6 11 8 6 8输出 8 0说明 装第三个物…

Node.js 的 child_process 模块详解

Node.js 的 child_process 模块提供了创建子进程的能力,使 Node.js 应用能够执行系统命令、运行其他程序或脚本。这个模块非常强大,可以帮助我们实现很多复杂的功能。 1. exec - 执行 shell 命令 exec 方法用于执行 shell 命令,并缓冲任何产生的输出。 特点 创建 shell 来…

进程与线程详细介绍

目录 一 进程概念 二 进程的组成 2.1 PCB 2.2 数据段 2.3 程序段 三 进程的五大特点 四 进程的创建与销毁 五 线程概念 六 线程特征 七 进程与线程的区别与联系 区别 联系 一 进程概念 进程是程序的一次执行过程,是操作系统进行资源分配和调度的基本单位…

如何在服务器后台运行Python脚本,并配置虚拟环境与GPU支持

使用Conda虚拟环境在服务器后台运行Python脚本,并检查GPU分配 在服务器开发环境中,我们需要确保Python脚本运行在指定的Conda虚拟环境中,并且确认是否正确分配了GPU资源。本文将通过一个完整的start.sh脚本,完成以下功能&#xff…

前端取经路——工程化渡劫:八戒的构建之道

大家好,我是老十三,一名前端开发工程师。前端工程化就像八戒的钉耙,看似简单却能降妖除魔。在本文中,我将带你探索前端工程化的九大难题,从模块化组织到CI/CD流程,从代码规范到自动化测试,揭示这些工具背后的核心原理。无论你是初学者还是资深工程师,这些构建之道都能帮…

Ubuntu 安装 Keepalived

Keepalived 是什么 Keepalived 是一个用于实现高可用性(High Availability, HA)的服务,是一款基于 VRRP 协议的高可用软件,常用于主备切换和虚拟IP漂移,在服务故障时自动实现故障转移。 Keepalived 的核心功能 功能说…

DHCP理解

文章目录 DHCP理解DHCP的核心作用DHCP默认端口DHCP的工作原理(4个步骤)图示说明(含中继代理)DHCP Discover(客户端发现阶段)DHCP Offer(服务器提供阶段)DHCP Request(客户…

云计算-容器云-部署CICD-jenkins连接gitlab

安装 Jenkins 将Jenkins部署到default命名空间下。要求完成离线插件的安装,设置Jenkins的登录信息和授权策略。 上传BlueOcean.tar.gz包 [root@k8s-master-node1 ~]#tar -zxvf BlueOcean.tar.gz [root@k8s-master-node1 ~]#cd BlueOcean/images/ vim /etc/docker/daemon.json…

AI 大模型新浪潮:从 DeepSeek-Prover 到 Qwen3,再到 DeepSeek-R2,迈向自动推理的新时代20250507

🧠 AI 大模型新浪潮:从 DeepSeek-Prover 到 Qwen3,再到 DeepSeek-R2,迈向自动推理的新时代 🚀 引言:大模型,不止是语言处理器,而是思维建构者 在 2025 年春天,我们见证了…

观察者模式(Observer Pattern)详解

文章目录 1. 什么是观察者模式?2. 为什么需要观察者模式?3. 观察者模式的核心概念4. 观察者模式的结构5. 观察者模式的基本实现简单的气象站示例6. 观察者模式的进阶实现推模型 vs 拉模型6.1 推模型(Push Model)6.2 拉模型(Pull Model)7. 观察者模式的复杂实现7.1 在线商…

前端代码规范详细配置

以下是现代前端项目的完整代码规范配置方案,涵盖主流技术栈和自动化工具链配置: 一、基础工程配置 1. 项目结构规范 project/ ├── src/ │ ├── assets/ # 静态资源 │ ├── components/ # 通用组件 │ ├── layouts/ …

Missashe考研日记-day34

Missashe考研日记-day34 1 专业课408 学习时间:3h学习内容: 今天是学习I/O管理第二小节的内容,听了课也做了题,这是操作系统倒数第二节知识了,还差最后一节就完结了。知识点回顾: 1.I/O核心子系统&#x…

Milvus 向量数据库详解与实践指南

一、Milvus 核心介绍 1. 什么是 Milvus? Milvus 是一款开源、高性能、可扩展的向量数据库,专门为海量向量数据的存储、索引和检索而设计。它支持近似最近邻搜索(ANN),适用于图像检索、自然语言处理(NLP&am…

算力经济模型研究:从云计算定价到去中心化算力市场设计

引言:算力商品化的双重革命 在H800 GPU集群的算力供给能力突破2.3 EFLOPS的今天,算力定价机制正经历从"资源租赁"到"动态市场"的范式转变。传统云计算定价模型(如AWS按需实例)的静态价格机制已难以适应大模型…

[D1,2] 贪心刷题

文章目录 摆动序列最大子数组合买卖股票跳跃游戏跳跃2 摆动序列 不像是贪心,只要抓住摆动这个点,前一个上升,那下一个就要下降,记录上一次的状态为1的话,那下一次就要更新为-1,如果上一次为1,这…

Spring Boot操作MongoDB的完整示例大全

以下是基于Spring Boot操作MongoDB的完整示例大全&#xff0c;涵盖增删改查、聚合查询、索引、事务等核心功能&#xff1a; 一、基础CRUD操作 1. 环境配置 依赖配置&#xff08;pom.xml&#xff09; <dependency><groupId>org.springframework.boot</groupId…

【实战教程】零基础搭建DeepSeek大模型聊天系统 - Spring Boot+React完整开发指南

&#x1f525; 本文详细讲解如何从零搭建一个完整的DeepSeek AI对话系统&#xff0c;包括Spring Boot后端和React前端&#xff0c;适合AI开发入门者快速上手。即使你是编程萌新&#xff0c;也能轻松搭建自己的AI助手&#xff01; &#x1f4da;博主匠心之作&#xff0c;强推专栏…

Linux系统基本指令和知识指南

一、Linux系统简介 Linux是一种自由和开放源代码的类UNIX操作系统&#xff0c;由林纳斯托瓦兹在1991年首次发布。它以稳定性、安全性和灵活性著称&#xff0c;广泛应用于服务器、嵌入式系统和个人计算机。 Linux主要特点&#xff1a; 开源免费 多用户、多任务 良好的安全性…

【计算机视觉】OpenCV实战项目:Long-Exposure:基于深度学习的长时间曝光合成技术

Long-Exposure&#xff1a;基于深度学习的长时间曝光合成技术 项目概述与技术背景项目核心功能技术原理 环境配置与安装硬件要求建议详细安装步骤可选组件安装 实战应用指南1. 基础使用&#xff1a;视频转长曝光2. 高级模式&#xff1a;自定义光轨合成3. 批量处理模式 技术实现…

TikTok 矩阵账号运营实操细节:打造爆款矩阵

在 TikTok 的流量版图里&#xff0c;打造 TikTok 矩阵账号能显著提升影响力与吸粉能力。而借助 AI 工具&#xff0c;更可为 TikTok 矩阵运营效率的提升赋能&#xff0c;让运营如虎添翼。下面就为大家详细讲讲其中的实操细节&#xff0c;并结合一些伪代码示例辅助理解。 一、矩…