喀什网站制作阿里巴巴对外做网站吗
news/
2025/9/23 2:26:58/
文章来源:
喀什网站制作,阿里巴巴对外做网站吗,河北建设集团官网,有限公司怎么注册公司摘要#xff1a; 容器开启数据服务之旅系列#xff08;二#xff09;#xff1a;Kubernetes如何助力Spark大数据分析 #xff08;二#xff09;#xff1a;Kubernetes如何助力Spark大数据分析 概述 本文为大家介绍一种容器化的数据服务Spark OSS on ACK#xff0c;允许…摘要 容器开启数据服务之旅系列二Kubernetes如何助力Spark大数据分析 二Kubernetes如何助力Spark大数据分析 概述 本文为大家介绍一种容器化的数据服务Spark OSS on ACK允许Spark分布式计算节点对阿里云OSS对象存储的直接访问。
容器开启数据服务之旅系列二Kubernetes如何助力Spark大数据分析
二Kubernetes如何助力Spark大数据分析
概述
本文为大家介绍一种容器化的数据服务Spark OSS on ACK允许Spark分布式计算节点对阿里云OSS对象存储的直接访问。借助阿里云Kubernetes容器服务与阿里云OSS存储资源的深度整合允许Spark分布式内存计算机器学习集群对云上的大数据直接进行分析和保存结果。
先决条件
你已经通过阿里云容器服务创建了一个Kubernetes集群详细步骤参见创建Kubernetes集群
从容器服务控制台创建一个Spark OSS实例
使用三次点击来创建一个1 master 3 worker 的Spark OSS的实例
1 登录 https://cs.console.aliyun.com/ 2 点击 “应用目录” 3 选择 “spark-oss”, 点击 “参数”
给你的应用一个名字 e.g. spark-oss-online2必选填写你的oss_access_key_id和oss_access_key_secret
Worker:# set OSS access keyID and secretoss_access_key_id: Your sub-accountoss_access_key_secret: your key_secret of sub-account
3.可选修改工作节点数目 Worker.Replicas: 3
4 点击 “部署” 5 点击 “Kubernetes 控制台”查看部署实例6 点击 服务 查看外部端点, 点击URL访问Spark集群 7 测试Spark集群
1.打开一个spark-shell
kubectl get pod | grep worker
spark-oss-online2-worker-57894f65d8-fmzjs 1/1 Running 0 44m
spark-oss-online2-worker-57894f65d8-mbsc4 1/1 Running 0 44m spark-oss-online2-worker-57894f65d8-zhwr4 1/1 Running 0 44m
kubectl exec -it spark-oss-online2-worker-57894f65d8-fmzjs -- /opt/spark/bin/spark-shell --master spark://spark-oss-online2-master:7077
粘贴下列代码使用Spark测试OSS的读写性
// Save RDD to OSS bucket
val stringRdd sc.parallelize(Seq(Test Strings\n Test String2))
stringRdd.saveAsTextFile(oss://eric-new/testwrite12)// Read data from OSS bucket
val lines sc.textFile(oss://eric-new/testwrite12)
lines.take(10).foreach(println)
Test Strings Test String2
CLI 命令行操作
Setup keys and deploy spark cluster in one command
export OSS_IDyour oss id
export OSS_SECRETyour oss secretshelm install -n myspark-oss --set Worker.oss_access_key_id$OSS_ID,Worker.oss_access_key_secret$OSS_SECRET incubator/spark-oss
kubectl get svc| grep oss
myspark-oss-master ClusterIP 172.19.9.111 none 7077/TCP 2m
myspark-oss-webui LoadBalancer 172.19.13.1 120.55.104.27 8080:30477/TCP 2m
原文链接
干货好文请关注扫描以下二维码
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/911114.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!