菏泽住房和城乡建设部网站常德论坛市民留言尚一网
news/
2025/9/22 16:18:10/
文章来源:
菏泽住房和城乡建设部网站,常德论坛市民留言尚一网,注册外贸公司的条件及流程,公司网站建设工作计划目录 一、环境准备二、工作区限制三、什么是计算目标#xff1f;四、本地计算机五、远程虚拟机六、Apache Spark 池七、Azure HDInsight八、Azure Batch九、Azure Databricks十、Azure Data Lake Analytics十一、Azure 容器实例十二、Kubernetes 了解如何用 SDK v1 将 Azure 计… 目录 一、环境准备二、工作区限制三、什么是计算目标四、本地计算机五、远程虚拟机六、Apache Spark 池七、Azure HDInsight八、Azure Batch九、Azure Databricks十、Azure Data Lake Analytics十一、Azure 容器实例十二、Kubernetes 了解如何用 SDK v1 将 Azure 计算资源附加到 Azure 机器学习工作区。 然后可以将这些资源用作机器学习任务中的训练和推理计算目标 关注TechLead分享AI全维度知识。作者拥有10年互联网服务架构、AI产品研发经验、团队管理经验同济本复旦硕复旦机器人智能实验室成员阿里云认证的资深架构师项目管理专业人士上亿营收AI产品研发负责人。 一、环境准备 Azure 机器学习工作区。 有关详细信息请参阅创建工作区资源。 机器学习服务的 Azure CLI 扩展、Azure 机器学习 Python SDK 或 Azure 机器学习 Visual Studio Code 扩展。 二、工作区限制 请勿在工作区中为同一计算创建多个同步附件。 例如使用两个不同的名称将一个 Azure Kubernetes 服务群集附加到工作区。 每个新附件都会破坏先前存在的附件。 如果要重新附加计算目标来实现某个目的例如更改 TLS 或其他群集配置设置则必须先删除现有附件。 三、什么是计算目标 使用 Azure 机器学习可在不同的资源或环境统称为计算目标中训练模型。 计算目标可以是本地计算机也可以是云资源例如 Azure 机器学习计算、Azure HDInsight 或远程虚拟机。 还可以使用计算目标进行模型部署如部署模型的位置和方式中所述。 四、本地计算机
使用本地计算机进行训练时无需创建计算目标。 只需从本地计算机提交训练运行。
使用本地计算机进行推理时必须安装 Docker。 若要执行部署请使用 LocalWebservice.deploy_configuration() 来定义 Web 服务将使用的端口。 然后使用通过 Azure 机器学习部署模型中所述的常规部署流程。 五、远程虚拟机 Azure 机器学习还支持连接 Azure 虚拟机。 VM 必须是 Azure Data Science Virtual Machine (DSVM)。 此 VM 提供精选的工具和框架用于满足整个机器学习开发生命周期的需求。 有关如何将 DSVM 与 Azure 机器学习配合使用的详细信息请参阅配置开发环境。 创建Azure 机器学习无法为你创建远程 VM。 你需要自行创建 VM然后将其附加到 Azure 机器学习工作区。 要详细了解如何创建 DSVM请参阅预配适用于 Linux (Ubuntu) 的 Data Science Virtual Machine。 Azure 机器学习仅支持运行 Ubuntu 的虚拟机。 创建 VM 或选择现有 VM 时必须选择使用 Ubuntu 的 VM。 Azure 机器学习还要求虚拟机具有公共 IP 地址。 附加若要附加现有虚拟机作为计算目标必须提供虚拟机的资源 ID、用户名和密码。 可以使用订阅 ID、资源组名称和 VM 名称按以下字符串格式构造 VM 的资源 ID/subscriptions/subscription_id/resourceGroups/resource_group/providers/Microsoft.Compute/virtualMachines/vm_name from azureml.core.compute import RemoteCompute, ComputeTarget# Create the compute config
compute_target_name attach-dsvmattach_config RemoteCompute.attach_configuration(resource_idresource_id,ssh_port22,usernameusername,passwordpassword)# Attach the compute
compute ComputeTarget.attach(ws, compute_target_name, attach_config)compute.wait_for_completion(show_outputTrue)或者可以使用 Azure 机器学习工作室将 DSVM 附加到工作区。 请勿在工作区中为同一 DSVM 创建多个同步附件。 每个新附件都会破坏先前存在的附件。 配置为 DSVM 计算目标创建运行配置。 Docker 与 conda 用于在 DSVM 上创建和配置训练环境。 from azureml.core import ScriptRunConfig
from azureml.core.environment import Environment
from azureml.core.conda_dependencies import CondaDependencies# Create environment
myenv Environment(namemyenv)# Specify the conda dependencies
myenv.python.conda_dependencies CondaDependencies.create(conda_packages[scikit-learn])# If no base image is explicitly specified the default CPU image azureml.core.runconfig.DEFAULT_CPU_IMAGE will be used
# To use GPU in DSVM, you should specify the default GPU base Docker image or another GPU-enabled image:
# myenv.docker.enabled True
# myenv.docker.base_image azureml.core.runconfig.DEFAULT_GPU_IMAGE# Configure the run configuration with the Linux DSVM as the compute target and the environment defined above
src ScriptRunConfig(source_directory., scripttrain.py, compute_targetcompute, environmentmyenv) 如果要从工作区中删除拆离VM请使用 RemoteCompute.detach() 方法。
Azure 机器学习不会为你删除 VM。 必须使用 Azure 门户、CLI 或适用于 Azure VM 的 SDK 手动删除 VM。 六、Apache Spark 池 通过 Azure Synapse Analytics 与 Azure 机器学习的集成预览版你可以附加由 Azure Synapse 提供支持的 Apache Spark 池以进行交互式数据探索和准备。 借助这种集成你可使用专用计算大规模地进行数据整理。 有关详细信息请参阅如何附加由 Azure Synapse Analytics 提供支持的 Apache Spark 池。 七、Azure HDInsight
Azure HDInsight 是用于大数据分析的热门平台。 该平台提供的 Apache Spark 可用于训练模型。
创建Azure 机器学习无法为你创建 HDInsight 群集。 你需要自行创建群集然后将其附加到 Azure 机器学习工作区。 有关详细信息请参阅在 HDInsight 中创建 Spark 群集。
Azure 机器学习要求 HDInsight 群集具有公共 IP 地址。 创建群集时必须指定 SSH 用户名和密码。 请记下这些值因为在将 HDInsight 用作计算目标时需要用到这些值。 创建群集后使用主机名 clustername-ssh.azurehdinsight.net 连接到该群集其中clustername是为该群集提供的名称。
附加若要将 HDInsight 群集附加为计算目标必须提供该 HDInsight 群集的资源 ID、用户名和密码。 可以使用订阅 ID、资源组名称和 HDInsight 群集名称按以下字符串格式构造 HDInsight 群集的资源 ID/subscriptions/subscription_id/resourceGroups/resource_group/providers/Microsoft.HDInsight/clusters/cluster_name from azureml.core.compute import ComputeTarget, HDInsightComputefrom azureml.exceptions import ComputeTargetExceptiontry:# if you want to connect using SSH key instead of username/password you can provide parameters private_key_file and private_key_passphraseattach_config HDInsightCompute.attach_configuration(resource_idresource_id,ssh_port22, usernamessh-username, passwordssh-pwd)hdi_compute ComputeTarget.attach(workspacews, namemyhdi, attach_configurationattach_config)except ComputeTargetException as e:print(Caught {}.format(e.message))hdi_compute.wait_for_completion(show_outputTrue)或者可以使用 Azure 机器学习工作室将 HDInsight 群集附加到工作区。
请勿在工作区中为同一 HDInsight 创建多个同步附件。 每个新附件都会破坏先前存在的附件。 配置为 HDI 计算目标创建运行配置。 from azureml.core.runconfig import RunConfiguration
from azureml.core.conda_dependencies import CondaDependencies# use pyspark framework
run_hdi RunConfiguration(frameworkpyspark)# Set compute target to the HDI cluster
run_hdi.target hdi_compute.name# specify CondaDependencies object to ask system installing numpy
cd CondaDependencies()
cd.add_conda_package(numpy)
run_hdi.environment.python.conda_dependencies cd如果要从工作区中删除拆离HDInsight 群集请使用 HDInsightCompute.detach() 方法。
Azure 机器学习不会为你删除 HDInsight 群集。 必须使用 Azure 门户、CLI 或适用于 Azure HDInsight 的 SDK 将其手动删除。 八、Azure Batch
Azure Batch 用于在云中高效运行大规模并行高性能计算 (HPC) 应用程序。 可以在 Azure 机器学习管道中使用 AzureBatchStep 将作业提交到 Azure Batch 计算机池。
若要将 Azure Batch 附加为计算目标必须使用 Azure 机器学习 SDK 并提供以下信息
Azure Batch 计算名称在工作区中用于计算的易记名称Azure Batch 帐户名称Azure Batch 帐户的名称资源组包含 Azure Batch 帐户的资源组。
以下代码演示如何将 Azure Batch 附加为计算目标
from azureml.core.compute import ComputeTarget, BatchCompute
from azureml.exceptions import ComputeTargetException# Name to associate with new compute in workspace
batch_compute_name mybatchcompute# Batch account details needed to attach as compute to workspace
batch_account_name batch_account_name # Name of the Batch account
# Name of the resource group which contains this account
batch_resource_group batch_resource_grouptry:# check if the compute is already attachedbatch_compute BatchCompute(ws, batch_compute_name)
except ComputeTargetException:print(Attaching Batch compute...)provisioning_config BatchCompute.attach_configuration(resource_groupbatch_resource_group, account_namebatch_account_name)batch_compute ComputeTarget.attach(ws, batch_compute_name, provisioning_config)batch_compute.wait_for_completion()print(Provisioning state:{}.format(batch_compute.provisioning_state))print(Provisioning errors:{}.format(batch_compute.provisioning_errors))print(Using Batch compute:{}.format(batch_compute.cluster_resource_id))请勿在工作区中为同一 Azure Batch 创建多个同步附件。 每个新附件都会破坏先前存在的附件。
九、Azure Databricks
Azure Databricks 是 Azure 云中基于 Apache Spark 的环境。 它可以用作 Azure 机器学习管道的计算目标。
Azure 机器学习无法创建 Azure Databricks 计算目标。 而必须由你自行创建一个 Azure Databricks 工作区然后将其附加到 Azure 机器学习工作区。 若要创建工作区资源请参阅在 Azure Databricks 中运行 Spark 作业文档。
若要从不同 Azure 订阅附加 Azure Databricks 工作区你你的 Microsoft Entra 帐户必须被授予 Azure Databricks 工作区的“参与者”角色。 查看 Azure 门户中的访问权限。
要将 Azure Databricks 附加为计算目标请提供以下信息
Databricks 计算名称要分配给此计算资源的名称。Databricks 工作区名称Azure Databricks 工作区的名称。Databricks 访问令牌用于对 Azure Databricks 进行身份验证的访问令牌。 若要生成访问令牌请参阅身份验证文档。
以下代码演示如何使用 Azure 机器学习 SDK 将 Azure Databricks 附加为计算目标
import os
from azureml.core.compute import ComputeTarget, DatabricksCompute
from azureml.exceptions import ComputeTargetExceptiondatabricks_compute_name os.environ.get(AML_DATABRICKS_COMPUTE_NAME, databricks_compute_name)
databricks_workspace_name os.environ.get(AML_DATABRICKS_WORKSPACE, databricks_workspace_name)
databricks_resource_group os.environ.get(AML_DATABRICKS_RESOURCE_GROUP, databricks_resource_group)
databricks_access_token os.environ.get(AML_DATABRICKS_ACCESS_TOKEN, databricks_access_token)try:databricks_compute ComputeTarget(workspacews, namedatabricks_compute_name)print(Compute target already exists)
except ComputeTargetException:print(compute not found)print(databricks_compute_name {}.format(databricks_compute_name))print(databricks_workspace_name {}.format(databricks_workspace_name))print(databricks_access_token {}.format(databricks_access_token))# Create attach configattach_config DatabricksCompute.attach_configuration(resource_groupdatabricks_resource_group,workspace_namedatabricks_workspace_name,access_tokendatabricks_access_token)databricks_compute ComputeTarget.attach(ws,databricks_compute_name,attach_config)databricks_compute.wait_for_completion(True)有关更详细的示例请参阅 GitHub 上的 示例笔记本。
请勿在工作区中为同一 Azure Databricks 创建多个同步附件。 每个新附件都会破坏先前存在的附件。
十、Azure Data Lake Analytics
Azure Data Lake Analytics 是 Azure 云中的大数据分析平台。 它可以用作 Azure 机器学习管道的计算目标。
使用该平台之前请先创建 Azure Data Lake Analytics 帐户。 若要创建此资源请参阅 Azure Data Lake Analytics 入门文档。
若要将 Data Lake Analytics 附加为计算目标必须使用 Azure 机器学习 SDK 并提供以下信息
计算名称要分配给此计算资源的名称。资源组包含 Data Lake Analytics 帐户的资源组。帐户名称Data Lake Analytics 帐户名。
以下代码演示如何将 Data Lake Analytics 附加为计算目标
import os
from azureml.core.compute import ComputeTarget, AdlaCompute
from azureml.exceptions import ComputeTargetExceptionadla_compute_name os.environ.get(AML_ADLA_COMPUTE_NAME, adla_compute_name)
adla_resource_group os.environ.get(AML_ADLA_RESOURCE_GROUP, adla_resource_group)
adla_account_name os.environ.get(AML_ADLA_ACCOUNT_NAME, adla_account_name)try:adla_compute ComputeTarget(workspacews, nameadla_compute_name)print(Compute target already exists)
except ComputeTargetException:print(compute not found)print(adla_compute_name {}.format(adla_compute_name))print(adla_resource_id {}.format(adla_resource_group))print(adla_account_name {}.format(adla_account_name))# create attach configattach_config AdlaCompute.attach_configuration(resource_groupadla_resource_group,account_nameadla_account_name)# Attach ADLAadla_compute ComputeTarget.attach(ws,adla_compute_name,attach_config)adla_compute.wait_for_completion(True)有关更详细的示例请参阅 GitHub 上的 示例笔记本。
请勿在工作区中为同一 ADLA 创建多个同步附件。 每个新附件都会破坏先前存在的附件。
Azure 机器学习管道只能处理 Data Lake Analytics 帐户的默认数据存储中存储的数据。 如果需要处理的数据不在默认存储中可以在训练之前使用 DataTransferStep复制数据。 十一、Azure 容器实例
Azure 容器实例 (ACI) 是在部署模型时动态创建的。 不能以任何其他方式创建 ACI 和将其附加到工作区。 有关详细信息请参阅将模型部署到 Azure 容器实例。
十二、Kubernetes Azure 机器学习提供了用于为训练和推理附加你自己的 Kubernetes 群集的选项。 请参阅配置 Kubernetes 群集以进行 Azure 机器学习。
若要从工作区分离 Kubernetes 群集请使用以下方法
compute_target.detach()关注TechLead分享AI全维度知识。作者拥有10年互联网服务架构、AI产品研发经验、团队管理经验同济本复旦硕复旦机器人智能实验室成员阿里云认证的资深架构师项目管理专业人士上亿营收AI产品研发负责人。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/909608.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!