【AWS入门】Amazon SageMaker简介

【AWS入门】Amazon SageMaker简介

[AWS Essentials] Brief Introduction to Amazon SageMaker

By Jackson@ML

机器学习(Machine Learning,简称ML) 是当代流行的计算机科学分支技术。通常,人们在本地部署搭建环境,以满足机器学习的要求。
AWS是Amazon Web Service,即亚马逊云科技,其提供给用户超过200种云产品和服务。用户无需搭建硬件环境,就可以实现科学计算、数据分析、项目开发和运维、大数据、无服务器应用开发、人工智能等一系列技术创新和迭代。

访问AWS官网,可以看到Amazon SageMaker主页面。

在这里插入图片描述
图1 Amazon SageMaker主页面

AWS提供了机器学习的专有产品和服务,就是 Amazon SageMaker,利用业界先进的AI技术,在云平台上应用和完成机器学习。

1. 什么是Amazon SageMaker?

Amazon SageMaker AI 是一项云托管服务,它对机器学习 (ML) 服务完全托管。借助 SageMaker AI,广大用户包括数据科学家、人工智能专家、软件开发者,均可以快速、便捷地构建和训练 ML 模型,并将其快速部署到生产环境中。

Amazon SageMaker AI为运行 ML 工作流提供了用户界面体验,使 SageMaker AI ML 工具可在多个集成开发环境 (IDE) 中使用。

有了 SageMaker AI,用户就可以存储和共享数据,而无需构建和管理自己的服务器。这样,企业或用户就有更多时间来协作构建和开发特定功能的 ML 工作流程,并且可以高效完成工作。

SageMaker AI提供受控的ML算法,可在分布式环境中针对超大数据量运算高效运行。SageMaker AI 内置支持自带算法和框架,提供灵活的分布式训练选项,可根据用户需要的特定工作流程进行调整。用快捷的步骤,就能从 SageMaker AI 控制台将模型部署到安全、可扩展的环境中。

2. Amazon SageMaker主要功能

1) Amazon SageMaker新版发布

2024 年 12 月 03 日,AWS亚马逊云科技发布了新一代 Amazon SageMaker。

Amazon SageMaker 是数据、分析和人工智能的统一平台。新一代 SageMaker 集合了 AWS 机器学习和分析功能,为分析和人工智能提供了集成体验,可统一访问您的所有数据。

2) Amazon SageMaker 包括以下功能:
  • Amazon SageMaker AI(前身为 Amazon SageMaker)- 利用完全托管的基础架构、工具和工作流,构建、训练和部署 ML 和基础模型;
  • Amazon SageMaker Lakehouse - 跨 Amazon S3 数据湖、Amazon Redshift 和其它数据源统一数据访问;
  • Amazon SageMaker 数据和 AI 治理 - 利用基于 Amazon DataZone 构建的 Amazon SageMaker Catalog 安全地发现、治理和协作数据和 AI;
  • SQL 分析结构化查询语言(Structured Query Language)即SQL,是关系型数据库必不可少的语言。 借助 Amazon Redshift 最具性价比的 SQL 引擎获得洞察力;
  • Amazon SageMaker 数据处理 - 使用 Amazon Athena、Amazon EMR 和 AWS Glue 上的开源框架分析、准备和集成数据,以进行分析和人工智能;
  • Amazon SageMaker Unified Studio - 在单一开发环境中使用所有数据和工具进行构建,以进行分析和人工智能;
  • Amazon Bedrock - 构建和扩展生成式 AI 应用程序
  • 通过DeepL.com(免费版)翻译

3. 安装Amazon SageMaker

要使用 Amazon SageMaker AI 中的功能,首先必须有访问 Amazon SageMaker AI 的权限。

通过设置 Amazon SageMaker AI 及其功能,有以下安装选项:

  • 快速安装: 使用默认设置,为个人用户进行快捷安装配置。
  • 自定义安装: 面向企业机器学习 (ML) 管理员,这些高级配置对于那些为多用户或组织设置 SageMaker AI 的 ML 管理员来说,显示是个理想的选项。

4. 访问AWS门户和身份验证

AWS通过网络门户,对所有AWS账户分配对应用程序的单点登录访问,通过AWS的 IAM 身份验证和访问。

关于具体如何登录 AWS 访问门户、登录提示以及如何退出 AWS 访问门户,作为 IAM Identity Center 用户,可登录 AWS 访问门户,详细步骤请参阅《AWS 登录指南》中的相关章节,进一步了解如何登录 AWS 访问门户。

在这里插入图片描述
图2 在AWS登录IAM控制台

5. Amazon SageMaker AI域

Amazon SageMaker AI 使用域(domain)来组织用户配置文件、应用程序及其相关资源。
Amazon SageMaker AI 域由以下部分组成:

  • 相关的亚马逊弹性文件系统(亚马逊 EFS)卷
  • 授权用户列表
  • 各种安全、应用程序、策略和 Amazon 虚拟私有云 (Amazon VPC) 配置

每个域中都有私有应用程序和共享空间,如下图所示:

在这里插入图片描述
要访问大多数 Amazon SageMaker AI 环境和资源,用户必须使用 SageMaker AI 控制台或 AWS CLI 完成 Amazon SageMaker AI 域入门流程。

有关如何根据访问 SageMaker AI 的方式开始使用 SageMaker AI,以及必要时如何设置域的指南,请参阅 Amazon SageMaker AI 设置指南

6. Amazon SageMaker的优势

1) 融通式合作开发工作室

Amazon SageMaker 融通式合作开发工作室提供集成式体验,让用户可以使用适用于分析和人工智能的所有数据和工具。

通过发现数据,并使用熟悉的 AWS 工具(适用于模型开发、生成式人工智能、数据处理和 SQL 分析)将数据用于实处。

使用统一的笔记本电脑处理计算资源,使用内置的 SQL 编辑器发现和查询不同的数据来源,大规模训练和部署人工智能模型,快速构建自定义的生成式人工智能应用程序。创建并安全共享分析和人工智能构件,例如数据、模型和生成式人工智能应用程序,以更快地将数据产品推向市场。

2) 整套安全的人工智能开发功能

借助一整套设计安全的人工智能开发功能,推进 SageMaker 中的人工智能发展。在高性能且经济高效的基础设施上训练、自定义和部署机器学习和基础模型(Fundation Model, 即FM)

使用可满足整个人工智能生命周期需求的专用工具,覆盖高性能集成式开发环境(IDE)和分布式训练到推理、人工智能运维、治理和可观测性等领域。

使用尖端模型和专用数据,快速创建为业务量身定制的生成式人工智能应用程序。使用 Amazon Q Developer加快人工智能开发,帮助用户更加容易、轻松地发现数据、构建和训练机器学习模型、生成 SQL 查询以及创建和运行数据管道任务,所有这些都可通过自然语言完成。

3) 统一数据,减少数据孤岛

使用Amazon SageMaker数据湖仓,统一用户在 Amazon Simple Storage Service(Amazon S3)数据湖Amazon Redshift 数据仓库中的所有数据。

使用所有与 Apache Iceberg 兼容的工具和引擎,在分析数据的单个副本上灵活地访问和查询数据。

通过定义应用于湖仓中的分析和人工智能工具的精细权限来保护数据。通过零 ETL 集成,将运营数据库和应用程序中的数据近实时地导入湖仓。

此外,通过跨第三方数据来源的联合查询功能访问和查询数据。

4) 端对端数据和人工智能治理

通过贯穿整个数据和人工智能生命周期的内置治理,确保企业安全。Amazon SageMaker 确保用户能够控制正确的用户,用以出于正当理由访问正确的数据、模型和开发构建。

通过 Amazon SageMaker Catalog 的精细访问控制,使用单一权限模型一致地定义和强制执行访问策略。使用数据分类、毒性检测、防护机制和负责任的人工智能政策,以保护您的人工智能模型安全。

通过数据质量监控和自动化、敏感数据检测以及数据和机器学习任务流水线,让整个组织安心无忧。

在这里插入图片描述

关于Amazon SageMaker应用及开发,还有很多。

  • 鸣谢:AWS亚马逊云科技

AWS技术好文陆续推出,敬请关注、收藏和点赞👍。

您的认可,我的动力!😃

相关阅读:

  1. 【AWS入门】Amazon Bedrock简介
  2. 【AWS入门】Amazon Q Developer简介
  3. 【AWS入门】AWS Lambda应用简介
  4. 【AWS入门】Amazon Nova简介
  5. 【AWS入门】Amazon S3简介
  6. 【AWS入门】Amazon EC2简介
  7. 【AWS入门】Amazon云计算简介
  8. 【AWS入门】创建并使用AWS Builder ID
  9. 【AWS入门】AWS亚马逊云科技账户注册指南
  10. 2025最新版Python 3.13.3安装使用指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/81382.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决 Go 构建依赖超时问题:使用 GOPROXY 提升 Docker 构建稳定性

目录 解决 Go 构建依赖超时问题:使用 GOPROXY 提升 Docker 构建稳定性 ✅ 问题背景 ✅ 正确做法:多阶段中在 Go 阶段设置 GOPROXY ✅ 实际收获 🧪 小技巧:验证 GOPROXY 设置是否生效 ✅ 总结 解决 Go 构建依赖超时问题&#x…

【周输入】510周阅读推荐-3

前文 【周输入】510周阅读推荐-1-CSDN博客 【周输入】510周阅读推荐-2-CSDN博客 本次推荐 目录 前文 本次推荐 算法技术 模型产品 算法技术 vLLM和DeepSpeed部署模型的优缺点_vllm deepspeed-CSDN博客 优点缺点总结vLLM 适用于推理 优化内存管理 高效并行化 功能单…

Kubernetes控制平面组件:Kubelet详解(七):容器网络接口 CNI

云原生学习路线导航页(持续更新中) kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计(一)Kubernetes架构原则和对象设计(二)Kubernetes架构原则和对象设计(三)Kubernetes控…

【推荐】新准则下对照会计报表172个会计科目解释

序号 科目名称 对应的会计报表项目 序号 科目名称 对应的会计报表项目   一、资产类     二、负债类   1 1001 库存现金 货币资金 103 2001 短期借款 短期借款 2 1002 银行存款 货币资金 104 2101 交易性金融负债 易性金融负债 3 1012 其他货币资…

MongoDB的安装及简单使用

MongoDB 是一个开源的文档型 NoSQL 数据库​​,由 MongoDB Inc. 开发,专为灵活性和可扩展性设计。 特点: ​​1.文档模型​​:数据以 BSON(二进制 JSON)格式存储,支持嵌套结构。 ​​2.动态 S…

Gartner《如何将生成式人工智能(GenAI)集成到应用架构》学习心得

针对软件架构师、技术专业人士如何更好的把 GenAI 如何融入解决方案,提升用户体验、生产力并带来差异化成果的趋势,Gartner发布了《Integrating GenAI Into Your Application Architecture》研究报告。 报告首先介绍了 GenAI 的发展背景,指出其已成为主流趋势,大型语言模型…

IDEA - Windows IDEA 代码块展开与折叠(基础折叠操作、高级折叠操作)

一、基础折叠操作 折叠当前代码块:Ctrl - # 操作方式按下 【Ctrl】 键,再按下 【-】 键展开当前代码块:Ctrl # 操作方式按下 【Ctrl】 键,再按下 【】 键折叠所有代码块:Ctrl Shift - # 操作方式按下 【Ctrl】…

基于STM32F103与Marvell88W8686的WIFI无线监控视频传输系统研发(论文)

基于STM32F103与Marvell88W8686的WIFI无线监控视频传输系统研发 中文摘要 在当今社会信息化进程不断加速的时代背景下,众多领域对于监控系统的需求日益增长,像车内安全监控、电梯运行监控等场景都离不开监控系统的支持。过去,不少领域普遍采用…

Java基础知识总结(超详细整理)

一:概述 1.1Java类及类的成员 属性、方法、构造器、代码块、内部类 (1)数组 java虚拟机内存划分 各区域作用 内存解析 基本使用 两个变量指向一个一维数组 没有new就不会在堆里新开辟空间 (2)对象数组 (3&a…

StarRocks Community Monthly Newsletter (Apr)

版本动态 3.4.3 版本更新 核心功能升级 Routine Load和Stream Load新增Lambda表达式支持,支持复杂的列数据提取 增强JSON数据处理能力,支持将JSON Array/Object转为ARRAY/MAP类型 优化information_schema.task_runs视图查询,新增LIMIT支持…

探索AI新领域:生成式人工智能认证(GAI认证)助力职场发展

在数字化时代的大潮中,人工智能(AI)技术以其强大的影响力和广泛的应用前景,正逐步重塑我们的生活与工作方式。随着生成式AI技术的崛起,掌握这一前沿技能已成为职场竞争中的关键优势。那么,如何通过系统的学…

数据库触发器Trigger

在数据库管理系统中,触发器(Trigger)是一种特殊的存储过程,它在特定的事件发生时自动执行。触发器通常用于维护数据的完整性和一致性。通过事件触发而被执行,不能直接调用。 触发器的三要素 触发事件 before/after&a…

如何利用 Java 爬虫获得某书笔记详情:实战指南

在知识分享和学习的领域,许多平台提供了丰富的书籍笔记和学习资源。通过 Java 爬虫技术,我们可以高效地获取这些笔记的详细信息,以便进行进一步的分析和整理。本文将详细介绍如何利用 Java 爬虫获取某书笔记详情,并提供完整的代码…

主成分分析的应用之sklearn.decomposition模块的PCA函数

主成分分析的应用之sklearn.decomposition模块的PCA函数 一、模型建立整体步骤 二、数据 2297.86 589.62 474.74 164.19 290.91 626.21 295.20 199.03 2262.19 571.69 461.25 185.90 337.83 604.78 354.66 198.96 2303.29 589.99 516.21 236.55 403.92 730.05 438.41 225.80 …

【Redis】List 列表

文章目录 初识列表常用命令lpushlpushxlrangerpushrpushxlpop & rpoplindexlinsertllen阻塞操作 —— blpop & brpop 内部编码应用场景 初识列表 列表类型,用于存储多个字符串。在操作和实现上,类似 C 的双端队列,支持随机访问(O(N)…

Android framework 中间件开发(三)

前两篇我们讲了中间件的开发和打包应用, Android framework 中间件开发(一) Android framework 中间件开发(二) 这边我们来讲一下在中间件中编写JNI 1.新建C文件 找到frameworks\base\services\core\jni\路径,新建一个cpp文件,文件名为com_android_server_DarkControlService.c…

深入了解linux系统—— 基础IO(上)

文件 在之前学习C语言文件操作时,我们了解过什么是文件,这里简单回顾一下: 文件存在磁盘中,文件有分为程序文件、数据文件;二进制文件和文本文件等。 详细描述见文章:文件操作——C语言 文件在磁盘里&a…

Flink CDC—实时数据集成框架

Flink CDC 是一个基于流的数据集成工具,旨在为用户提供一套功能更加全面的编程接口(API),它基于数据库日志的 CDC(变更数据捕获)技术实现了统一的增量和全量数据读取。 该工具使得用户能够以 YAML 配置文件…

ES(ES2023/ES14)最新更新内容,及如何减少内耗

截至2023年10月,JavaScript(ECMAScript)的最新版本是 ES2023(ES14)。 ES2023 引入了许多新特性,如findLast、toSorted等,同时优化了性能。通过减少全局变量、避免内存泄漏、优化循环、减少DOM操作、使用Web Workers、懒加载、缓存、高效数据结构和代码压缩,可以显著降低…

常见的 Python 环境配置问题及解决方案

1. Python 环境配置的常见问题 初学者在配置 Python 环境时,可能会遇到以下几类问题: 1.1 不同版本的兼容性 Python 目前有两个主要版本系列:Python 2.x 和 Python 3.x。Python 2.x 已于 2020 年 1 月 1 日停止维护,因此强烈建…