AWS Sagemaker详解

Sagemaker各个组件的介绍

Ground Truth

  1. Sagemaker Ground Truth Labeling platform。
  2. 图片语义分析= Amazon SageMaker Ground Truth semantic segmentation labeling task
  3. Ground Truth Active Learning will require human labelling only when needed, works well with small internal team

Carify

  1. Sagemaker Clarify 评估模型,解释模型(SHAP),优化模型。
  2. 检测数据偏差(bias)。

Debugger

  1. Sagemaker Debugger可以监控模型训练中的weights,梯度等,并据此优化模型提高计算效率。
  2. Sagemaker Debugger可以展示SHAP。

Monitor

  1. Sagemaker Monitor监控 model drift。

Data Wrangler(特征工程、数据准备)

  1. Sagemaker Data Wrangler preconfigured transformation/template快速探索特征和数据准备。
  2. Data Wrangler还可以检测样本的outliers、bias。以及进行归一化。

AutoPilot

  1. Amazon SageMaker Autopilot 无代码ML,但不支持custom container。

Canvas

  1. 无代码数据准备。

Endpoint

  1. 一个Sagemaker endpoint可以带多个model production variants。通过DesiredWeight提高模型Variant的使用率。
  2. A/B test=create a new endpoint configuration with two variant then update the existing endpoint.

Experiment

  1. Sagemaker Experiment比较不同模型、不同参数、不同数据的训练效果。支持custom container。

NEO

  1. Sagemaker Neo优化模型,使机器学习模型预测可在云和边缘站点中的任何位置运行。

Feature Store特征商店

  1. Online feature store for online inference。Offline store for training。
  2. Feature store GetRecord API获取最新的record。

网络、安全、日志相关

  1. Sagemaker的instance可以建在用户的VPC中,也可以在AWS Managed Service Account在VPC中。
  2. Sagemaker的如下信息可以在Cloudwatch中看:
    1. Sagemaker服务器情况
    2. 模型性能
    3. 模型运行日志
  3. CloudTrail可以记录模型的部署事件,Sagemaker API调用。
  4. Notebook instance在private subnet时,可以用S3 VPC endpoint来访问S3.
  5. Notebook instance can disable internet access.
  6. Sagemaker VPC interface endpoint(severless)可以配合AWS PrivateLink。
  7. 限制Sagemaker API call的IAM User = VPC endpoint policy。限制Sagemaker API call的instance = security group
  8. Network isolation for training jobs处理机密或敏感数据。
  9. private workforce in Amazon SageMaker Ground Truth make the data accessible to authorized users only.
  10. Notebook presigned URL can restrict IP.
  11. Sagemaker的Jupyter Notebook能自动打补丁。
  12. 通过RAM跨账号分享特征。

成本相关

  1. GPU服务器高效使用 = ECS with GPU
  2. AWS Deep Learning Containers+AWS Batch+spot instance=省钱运行长时间的机器学习任务
  3. Endpoint instance自动扩缩容
  4. Managed spot training with job checkpoint enabled.
  5. Sagemaker batch transform=Serverless Inference
  6. Amazon Elastic Inference(retired)
  7. Sagamaker Debugger vanishing_gradient and LowGPUUtilization rules
  8. 调整CPU:GPU ratio

技巧

  1. Sagemaker访问大量的训练数据,使用pipe input mode处理大文件,Fastfile mode处理S3小文件。
  2. RecordIO是Sagemaker中专用的提升模型训练速度的数据格式,支持图片。
  3. Sagemaker支持使用ECR中的自定义镜像。
  4. Sagemaker ENTRYPOINT用来指向自定义容器的训练程序。
  5. Sagemaker Python SDK支持私域训练。(no WiFi)
  6. Lifecycle configuration enable auto package installation.
  7. Sagemaker endpoint重新训练后有violation=run the model monitor baseline job again
  8. Sagemaker可以读取EFS。
  9. Sagemaker notebook可以通过glue development endpoint来创建。
  10. Sagemaker Pipeline 调度模型的取数,训练和部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/759456.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何画好架构图

什么是架构图? 架构图 架构的表达 架构在不同抽象角度和不同抽象层次的表达 架构可以从很多个角度去看,比如:业务架构、应用架构、技术架构、代码架构、数据架构等。 从架构级别来分类,使用金字塔的说明,上层级别…

图像分割论文阅读:Adaptive Context Selection for Polyp Segmentation

这篇论文的主要内容是关于一种用于息肉分割的自适应上下文选择网络(Adaptive Context Selection Network,简称ACSNet) 1,模型的整体结构 模型的整体结构基于编码器-解码器框架,并且包含了三个关键模块:局部…

贵州省二级分类土地利用数据(矢量)

贵州省,地处中国西南腹地,地貌属于中国西南部高原山地,境内地势西高东低,自中部向北、东、南三面倾斜,平均海拔在1100米左右。贵州高原山地居多,素有“八山一水一分田”之说。全省地貌可概括分为&#xff1…

列表(list)篇(二)

文章目录 2.10 insert()函数2.11 list()函数2.12 pop() 函数2.13 remove()函数2.14 reverse()函数2.15 sort()函数2.16 sorted()函数2.17 sum()函数 2.10 insert()函数 在Python中,list.insert()是一个列表方法,用于在指定索引位置插入一个元素。这个方…

【鸿蒙HarmonyOS开发笔记】通知模块之为通知添加行为意图

概述 WantAgent提供了封装行为意图的能力,这里所说的行为意图主要是指拉起指定的应用组件及发布公共事件等能力。HarmonyOS支持以通知的形式,将WantAgent从发布方传递至接收方,从而在接收方触发WantAgent中指定的意图。例如,在通…

RK3568平台开发系列讲解(pinctrl篇)引脚的复用关系的设置

🚀返回专栏总目录 文章目录 一、调用pinctrl_bind_pins二、dev_pin_info结构体沉淀、分享、成长,让自己和他人都能有所收获!😄 引脚的复用关系是在什么时候被设置的。 一、调用pinctrl_bind_pins 在内核源码目录下的 “drivers/base/dd.c” 文件中 static int really_p…

Java项目:67 ssm家政服务网站设计+jsp

作者主页:源码空间codegym 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 家政服务网站,主要的模块包括查看 管理员;个人中心、用户管理、服务类型管理、家政类型管理、家政评价管理、家政资讯…

Cesium for UE-01-虚幻引擎的下载安装及插件配置

学习Cesium for UE的过程笔记 下载UE 下载 下载完成后,点击运行,执行安装 安装完成后需要下载epic game 下载完成,需要登录 没有账号的自行注册,或者选一个有账号的平台登录即可 选择虚幻引擎,再点击库 可以看到下…

课时70:流程控制_for循环_嵌套循环

2.4.4 嵌套循环 学习目标 这一节,我们从 基础知识、简单实践、小结 三个方面来学习。 基础知识 简介 这里的嵌套实践,与选择语句的嵌套实践基本一致,只不过组合的方式发生了一些变化。常见的组合样式如下:for嵌套for语句for …

【工具使用】VScode配置gcc开发环境

一,简介 本文主要介绍如何在VScode中配置gcc环境,方便开发调试。 二,配置步骤 2.1 gcc环境配置 2.1.1 安装gcc环境 这里我使用的是msys2,具体安装步骤可以参考我另外一篇文章《史上最全msys2下载配置操作步骤》,这…

SpringCloud-Feign远程调用

使用Feign替代RestTemplate进行远程服务调用&#xff1a; 远程调用配置 1. 引入依赖 我们在order-service服务的pom文件中引入feign的依赖&#xff1a; <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starte…

LeetCode 45. 跳跃游戏 II java题解

题目 贪心 class Solution {public int jump(int[] nums) {int nnums.length;int max0;//能到达的最远位置int endmax;//边界int res0;//跳跃次数for(int i0;i<n-1;i){//最后一个位置不用跳maxMath.max(max,inums[i]);if(iend){//到达边界。end取决于更新之前的maxendmax;//…

计算机三级——网络技术(综合题第二题)

路由器工作模式 用户模式 当通过Console或Telnet方式登录到路由器时&#xff0c;只要输入的密码正确&#xff0c;路由器就直接进入了用户模式。在该模式下&#xff0c;系统提示符为一个尖括号(>)。如果用户以前为路由器输入过名称&#xff0c;则该名称将会显示在尖指号的前…

C++11关键字auto的理解和运用

auto的实际价值就是简化代码&#xff0c;类型很长时可以自动推导。也可以用typedef&#xff0c;main函数里面也能typedef&#xff0c;不一定要在全局定义。 &#xff08;1&#xff09;类型别名思考 随着程序越来越复杂&#xff0c;程序中用到的类型也越来越复杂&#xff0c;经…

idea2022中修改护眼主题色和注释颜色

背景&#xff1a;重装了2022版本idea&#xff0c;想改idea的颜色 背景修改 效果如下。护眼模式好了 修改注释

axios、axios二次封装、api解耦

import axios from axios// 环境的切换切换测试与生产环境 if (process.env.NODE_ENV development) { axios.defaults.baseURL /api; } else if (process.env.NODE_ENV debug) { axios.defaults.baseURL ; } else if (process.env.NODE_ENV production) { axios.…

Kafka生产者相关概念

文章目录 Kafka工作流程Kafka文件存储生产者分区策略生产者ISR生产者ack机制数据一致性问题ExactlyOnce Kafka工作流程 Kafka中消息是以topic进行分类的&#xff0c;Producer生产消息&#xff0c;Consumer消费消息&#xff0c;都是面向topic的。 Topic是逻辑上的概念&#xff…

流畅的 Python 第二版(GPT 重译)(十)

第十八章&#xff1a;with、match 和 else 块 上下文管理器可能几乎与子例程本身一样重要。我们只是初步了解了它们。[…] Basic 有一个 with 语句&#xff0c;在许多语言中都有 with 语句。但它们的功能不同&#xff0c;它们都只是做一些非常浅显的事情&#xff0c;它们可以避…

C#实现贪吃蛇游戏

定义贪吃蛇和游戏逻辑 定义数据结构&#xff1a;创建一个类来表示贪吃蛇的每个部分&#xff08;通常是一个具有X和Y坐标的结构体或类&#xff09;。定义游戏状态&#xff1a;包括蛇的位置、方向、长度以及食物的位置。处理键盘输入&#xff1a;重写窗体的键盘事件处理函数&…

微服务day04(下) -- SpringAMQP

SpringAMQP SpringAMQP是基于RabbitMQ封装的一套模板&#xff0c;并且还利用SpringBoot对其实现了自动装配&#xff0c;使用起来非常方便。 SpringAmqp的官方地址&#xff1a;Spring AMQP SpringAMQP提供了三个功能&#xff1a; 自动声明队列、交换机及其绑定关系 基于注解的…