上海网站开发团队网站建设情况汇报

news/2025/10/3 4:11:29/文章来源:
上海网站开发团队,网站建设情况汇报,网站淘宝客 没备案怎么做,重庆智能网站建设公司一、背景 1、背景信息 现有湖仓一体架构是以 MaxCompute 为中心读写 Hadoop 集群数据#xff0c;有些线下 IDC 场景#xff0c;客户不愿意对公网暴露集群内部信息#xff0c;需要从 Hadoop 集群发起访问云上的数据。本文以 EMR #xff08;云上 Hadoop#xff09;方式模…一、背景 1、背景信息 现有湖仓一体架构是以 MaxCompute 为中心读写 Hadoop 集群数据有些线下 IDC 场景客户不愿意对公网暴露集群内部信息需要从 Hadoop 集群发起访问云上的数据。本文以 EMR 云上 Hadoop方式模拟本地 Hadoop 集群访问 MaxCompute数据。 2、基本架构 二、搭建开发环境 1、EMR环境准备 1购买 ① 登录阿里云控制台 - 点击右上角控制台选项 https://www.aliyun.com/accounttraceidbc277aa7c0c64023b459dd695ac328b1jncu ② 进入到导航页 - 点击云产品 - E-MapReduce也可以搜索 ③ 进入至 E-MapReduce 首页点击 EMR on ECS - 创建集群 -- 具体购买细节参考官方文档 https://help.aliyun.com/document_detail/176795.html#section-55q-jmm-3ts ④ 点击集群ID 可查看集群的基础信息、集群服务以及节点管理等模块 2登录 -- 详细登录集群方式可参考官方文档 https://help.aliyun.com/document_detail/169150.html -- 本文以登录ECS实例操作 ① 点击阿里云首页控制台 - 云服务器ECS https://www.aliyun.com/product/ecs?spm5176.19720258.J_3207526240.92.542b2c4aSz6c39 ② 点击实例名称 - 远程连接 - Workbench远程连接 2、本地IDEA准备 1安装maven -- 可参考文档 https://blog.csdn.net/l32273/article/details/123684435 2创建Scala项目 ① 下载Scala插件 ② 安装 Scala JDK -- 建议下载 *.zip 文件 -- 配置 Scala 环境变量 -- 通过 Win R 打开 cmd 测试是否出现 Scala版本 -- 可参考文档 https://blog.csdn.net/m0_59617823/article/details/124310663 ③ 创建 Scala 项目 3、MaxCompute数据准备 1Project -- MaxCompute 创建 project 可参考官方文档 https://help.aliyun.com/document_detail/27815.html 2AccessKey -- 简称AK包括AccessKey ID和AccessKey Secret是访问阿里云API的密钥。在阿里云官网注册云账号后可以在AccessKey管理页面生成该信息用于标识用户为访问MaxCompute、其他阿里云产品或连接第三方工具做签名验证。请妥善保管AccessKey Secret必须保密如果存在泄露风险请及时禁用或更新AccessKey。 -- 查找 ak 可参考官方文档 https://ram.console.aliyun.com/manage/ak?spma2c4g.11186623.0.0.24704213IXakh3 3Endpoint -- MaxCompute服务连接地址为Endpoint取值由地域及网络连接方式决定 -- 各地域 endpoint 可参考官方文档 https://help.aliyun.com/document_detail/34951.html 4table -- MaxCompute 创建表可参考官方文档 https://help.aliyun.com/document_detail/73768.html -- 本文需准备分区表和非分区表供测试使用 三、代码测试 1、前提条件 1准备 MaxCompute 上的project、ak信息以及表数据 2准备 E-MapReduce集群 3终端连接 E-MapReduce节点即 ECS 实例 4本地 IDEA 需配置 Scala 环境变量、maven 环境变量 并下载 Scala 插件 2、代码示例 https://github.com/aliyun/aliyun-maxcompute-data-collectors/blob/master/spark-datasource-v3.1/src/test/scala/PartitionDataReaderTest.scala 3、打包上传 1本地写好代码后maven 打包 2本地编译jar包 ① 进入project目录 cd ${project.dir}/spark-datasource-v3.1 ② 执行mvn命令构建spark-datasource mvn clean package jar:test-jar ③ 查看 target 目录下是否有 dependencies.jar 和 tests.jar 3打好的 jar 包上传至服务器 ① scp 命令上传 scp [本地jar包路径] root[ecs实例公网IP]:[服务器存放jar包路径] ② 服务器查看 ③ 各节点之间上传 jar 包 scp -r [本服务器存放jar包路径] rootecs实例私网IP[接收的服务器存放jar包地址] 4、测试 1运行模式 ① Local 模式指定 master 参数为 local ./bin/spark-submit \--master local \--jars ${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-jar-with-dependencies.jar,${project.dir}/spark-datasource-v2.3/libs/cupid-table-api-1.1.5-SNAPSHOT.jar,${project.dir}/spark-datasource-v2.3/libs/table-api-tunnel-impl-1.1.5-SNAPSHOT.jar \--class DataReaderTest \${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-tests.jar \${maxcompute-project-name} \${aliyun-access-key-id} \${aliyun-access-key-secret} \${maxcompute-table-name} ② yarn 模式指定master 参数为 yarn、代码中 endpoint 选择以 -inc 结尾 代码val ODPS_ENDPOINT http://service.cn-beijing.maxcompute.aliyun-inc.com/api./bin/spark-submit \--master yarn \--jars ${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-jar-with-dependencies.jar,${project.dir}/spark-datasource-v2.3/libs/cupid-table-api-1.1.5-SNAPSHOT.jar,${project.dir}/spark-datasource-v2.3/libs/table-api-tunnel-impl-1.1.5-SNAPSHOT.jar \--class DataReaderTest \${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-tests.jar \${maxcompute-project-name} \${aliyun-access-key-id} \${aliyun-access-key-secret} \${maxcompute-table-name} 2读非分区表表测试 ① 命令 -- 首先进入spark执行环境 cd /usr/lib/spark-current -- 提交任务 ./bin/spark-submit \--master local \--jars ${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-jar-with-dependencies.jar,${project.dir}/spark-datasource-v2.3/libs/cupid-table-api-1.1.5-SNAPSHOT.jar,${project.dir}/spark-datasource-v2.3/libs/table-api-tunnel-impl-1.1.5-SNAPSHOT.jar \--class DataReaderTest \${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-tests.jar \${maxcompute-project-name} \${aliyun-access-key-id} \${aliyun-access-key-secret} \${maxcompute-table-name} ② 执行界面 ③ 执行结果 2读分区表测试 ① 命令 -- 首先进入spark执行环境 cd /usr/lib/spark-current -- 提交任务 ./bin/spark-submit \--master local \--jars ${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-jar-with-dependencies.jar,${project.dir}/spark-datasource-v2.3/libs/cupid-table-api-1.1.5-SNAPSHOT.jar,${project.dir}/spark-datasource-v2.3/libs/table-api-tunnel-impl-1.1.5-SNAPSHOT.jar \--class DataWriterTest \${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-tests.jar \${maxcompute-project-name} \${aliyun-access-key-id} \${aliyun-access-key-secret} \${maxcompute-table-name} \${partition-descripion} ② 执行界面 ③ 执行结果 3写非分区表表测试 ① 命令 ./bin/spark-submit \--master local \--jars ${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-jar-with-dependencies.jar,${project.dir}/spark-datasource-v2.3/libs/cupid-table-api-1.1.5-SNAPSHOT.jar,${project.dir}/spark-datasource-v2.3/libs/table-api-tunnel-impl-1.1.5-SNAPSHOT.jar \--class DataWriterTest \${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-tests.jar \${maxcompute-project-name} \${aliyun-access-key-id} \${aliyun-access-key-secret} \${maxcompute-table-name} ② 执行界面 ③ 执行结果 4写分区表测试 ① 命令 ./bin/spark-submit \--master local \--jars ${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-jar-with-dependencies.jar,${project.dir}/spark-datasource-v2.3/libs/cupid-table-api-1.1.5-SNAPSHOT.jar,${project.dir}/spark-datasource-v2.3/libs/table-api-tunnel-impl-1.1.5-SNAPSHOT.jar \--class DataWriterTest \${project.dir}/spark-datasource-v3.1/target/spark-datasource-1.0-SNAPSHOT-tests.jar \${maxcompute-project-name} \${aliyun-access-key-id} \${aliyun-access-key-secret} \${maxcompute-table-name} \${partition-descripion} ② 执行过程 ③ 执行结果 5、性能测试 -- 由于实验环境是 EMR 和 MC 属于云上互联如果 IDC 网络与云上相连取决于 tunnel 资源或者专线带宽 1大表读测试 -- size4829258484 byte -- partitions 593个 -- 读取分区 20170422 -- 耗时 0.850871 s 2大表写测试 ① 分区写入 万条 数据 -- 耗时2.5s -- 结果 ② 分区写入 十万条 数据 -- 耗时8.44 s -- 结果 ③ 分区写入 百万条 数据 -- 耗时73.28 s -- 结果 原文链接 本文为阿里云原创内容未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/925527.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站建设书店用户分几类教你做面膜v官方网站

如果拿下了一台机器之后寻找域控机器 ipconfig /all 找到域名 ping 域名或者nslookup域名

域名通过了才可以做网站吗长垣县做网站的

简单的介绍下Struts2中的几个简单的问题(namespace、action、以及path问题) namespace(命名空间) Namespace决定了action的访问路径,默认为“”,意味着可以访问所有目录下的/ass/sss/ss/index;囊括了所有pa…

响水企业做网站多少钱网络服务器租用

效果图:最左侧的分类列是跟随甘特图滚动的,因为这一列如果需要自定义,比如表格的话可能会存在行合并的情况,这个时候甘特图是没有办法做的,然后甘特图的表头又需要做滚动时固定,所以设置了甘特图滚动时&…

容桂网站建设济南黄河路桥建设集团官方网站

项目作者:小华的物联网嵌入式之旅 介绍:从事电气自动化行业,多次获得物联网设计竞赛,爱好嵌入式设计开发,物联网开发。 设计方案思路的由来,是因为我们现在的开发板基本需要通过串口与WIFI模组或以太网模…

做seo必须有自己网站吗wordpress图片上传卡住

绿*泡*泡: neituijunsir 交流裙 ,内推/实习/校招汇总表格 1、自动驾驶一周资讯 - 理想汽车发布第三季度财报;小米汽车现身工信部公告;小鹏汽车Q3营收超85亿元;11月前两周新势力销量排行榜 自动驾驶一周资讯 - 理想…

文献综述 php网站开发如何制作微信网站

一、启动与退出1、进入MySQL:输入命令:mysql -u root -p直接输入安装时的密码即可。此时的提示符是:mysql>2、退出MySQL:quit或exit3、数据库清屏命令:system clear;二、库操作1、创建数据库命令:create…

站长号查询入口站长工具怎么制作手机网页

Pyside6.5的nuitka_helper.py中的 qml_args.extend([f"--include-data-files{qml_file}./{qml_file.relative_to(source_file.parent)}"for qml_file in qml_files])在qml_file为相对路径的时候会报错。通过增加resolve()来强制转为绝对路径

做公众号推文的网站麻将app软件开发价格

首先,虽然本文是介绍IE浏览器下OCX控件播放RTSP或RTMP,但这种方式并不推荐,毕竟它只能用于IE浏览器环境下,局限太大,而且随着微软IE浏览器的更新,不确定后续支持情况。当然,话说回来&#xff0c…

如何建设一个网站深圳注明企业网站设计

PostgreSQL 笔记 一、简介 这里主要是记录学习 PostgreSQL 常用操作命令,方便今后查阅!!! PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS),在灵活的BSD许可证下发行。 PostgreSQL 开发者把它念作 post-gress…

网站上常用字体wordpress 有必要静态化

一般mysql存储的时间字段格式是" YYYY-MM-DD hh:mi:ss",即年月日之间是通过-分隔的。 偶然的情况下,发现这样的格式用在js时,在手机浏览器上运行会失败,但是在PC浏览器上却是OK的。 见代码: const st 201…

网站建设公司不挣钱的原因工信部网站备案通知

在前端开发中,我们通常关注时间复杂度和空间复杂度这两个算法概念,用于衡量算法或代码的性能。本文将深入介绍空间复杂度,探讨其在前端开发中的应用,并提供易懂的代码示例。 什么是空间复杂度? 空间复杂度是指算法在…

智能手机网站开发2023年防疫新政策

来源:The Information编译:厚势摘要:即使是近 10 年后,Waymo 仍远没有实现真正的 L4,即使是在相对简单的郊区环境下。「全自动驾驶的汽车来了!」去年 11 月,Waymo 搞了一个大新闻。公司宣布自己…

AI部署,NVIDIA显卡选择重要的参数速查表

参数速查表参数 定义/含义 对AI部署的影响 选型建议/要点架构/家族 GPU微架构代号(Turing、Ampere、Ada、Hopper…) 决定是否支持FP8/TF32、Transformer Engine、MIG、NVLink代际等 LLM训练与高端推理优先Hopper(如…

苏州网站建设上往建站软件外包公司的一生

DICOMDICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO 12052)。它定义了质量能满足临床需要的可用于数据交换的医学图像格式,可用于处理、…

网站建设属于哪个类目网址大全导航

以下是详细步骤。 创建大小为 V 的最小堆,其中 V 是给定图中的顶点数。最小堆的每个节点包含顶点编号和顶点的距离值。 以源顶点为根初始化最小堆(分配给源顶点的距离值为0)。分配给所有其他顶点的距离值为 INF(无限)。 当最小堆不为空时,执行以下操作: 从最小堆中提取…

discuz做商城网站第三方交易网站怎么做

for语句for语句是C语言所提供的一种功能广泛的循环语句。下图为for语句的标准形式:表达式1:通常用于给循环变量赋初值,一般是赋值表达式。表达式2:通常用于设立循环条件,一般为关系表达式或逻辑表达式。表达式3&#x…

专业网站建设科技公司成都最好的网站建设

复制文件 要求: 1、将原文件xxx.txt中的内容复制到新的文件里 2、新文件的文件名为xxx(复制).txt,即原文件名复制进行命名 大框架: 1、输入想要复制的文件xxx.txt input() 2、创建一个文件xxx(复制).txt f1 open(&quo…

最便宜网站空间成都设计公司排行建筑设计公司

共享办公室,也称为联合办公空间,是一种现代的工作空间模式,它允许不同公司或个体在一个共享的环境下工作,同时提供必要的办公设施和服务。这种模式打破了传统办公室的局限,提供了更高的灵活性和社区感。 共享办公室它通…

怎么添加网站背景音乐网站建设有哪些常用行为

类 类的大小 和结构体大小求法一致。但需注意,普通空类也会占用 1 字节大小,因为普通空类可以实例化对象。 而 抽象空类占 4 字节(32 位机中),因为抽象空类中含有虚指针(含有虚函数的非抽象空类同理&am…