网站建设方案和报价表软件开发人天报价标准

bicheng/2026/1/18 1:03:14/文章来源:
网站建设方案和报价表,软件开发人天报价标准,顺企网杭州网站建设,设计素材网址文章目录 1 Hive概述2 Hive部署2.1 规划2.2 安装软件 3 Hive体验4 Hive客户端4.1 HiveServer2 服务4.2 DataGrip 5 问题集5.1 Could not open client transport with JDBC Uri 结语 1 Hive概述 Apache Hive是一个开源的数据仓库查询和分析工具#xff0c;最初由Facebook开发最初由Facebook开发并后来捐赠给Apache软件基金会。Hive允许用户使用SQL语言来查询和分析存储在Hadoop分布式文件系统HDFS中的大规模数据集。它的设计目标是使非技术用户能够轻松地在Hadoop集群上执行数据查询和分析任务而无需编写复杂的MapReduce代码。 以下是Hive的主要特点和概述 SQL-Like查询语言 Hive提供了一种类似于SQL的查询语言称为HiveQLHive Query Language它允许用户使用熟悉的SQL语法来查询和操作数据。这使得数据库管理员和分析师能够更容易地利用Hadoop集群进行数据分析。元数据存储 Hive维护了一个元数据存储其中包含有关数据表、分区、列、数据类型和表之间关系的信息。这使得用户可以在不了解底层数据存储结构的情况下查询数据。扩展性 Hive是高度可扩展的可以处理大规模数据集。它允许用户将数据表分成分区并支持分区级别的操作从而提高了查询性能。UDF用户定义函数 Hive允许用户编写自定义函数以满足特定的数据处理需求。这些自定义函数可以使用Java或Python编写并与HiveQL一起使用。集成 Hive可以与其他Hadoop生态系统工具集成如Hadoop MapReduce、Apache HBase、Apache Spark等。这意味着用户可以在不同的工具之间共享数据并执行复杂的数据处理任务。可视化工具 虽然Hive本身是一个命令行工具但也有许多可视化工具和商业智能平台如Tableau、QlikView支持Hive使用户能够使用图形界面进行数据分析和报告生成。安全性 Hive提供了基于SQL标准的权限管理机制以确保只有授权的用户可以访问和修改数据。数据格式支持 Hive支持多种数据格式包括文本、Parquet、ORCOptimized Row Columnar等可以根据需求选择最适合的格式。 Hive通常用于数据仓库、数据分析、报告生成和数据ETL抽取、转换、加载等用例特别是对于那些需要在Hadoop集群上处理大规模数据的组织。它提供了一种方便的方式来查询和分析分布式存储的数据使更多的人能够从大数据中获得有价值的见解。 Apache Hive是一个开源的数据仓库查询和分析工具最初由Facebook开发并后来捐赠给Apache软件基金会。Hive允许用户使用SQL语言来查询和分析存储在Hadoop分布式文件系统HDFS中的大规模数据集。它的设计目标是使非技术用户能够轻松地在Hadoop集群上执行数据查询和分析任务而无需编写复杂的MapReduce代码。 以下是Hive的主要特点和概述 SQL-Like查询语言 Hive提供了一种类似于SQL的查询语言称为HiveQLHive Query Language它允许用户使用熟悉的SQL语法来查询和操作数据。这使得数据库管理员和分析师能够更容易地利用Hadoop集群进行数据分析。元数据存储 Hive维护了一个元数据存储其中包含有关数据表、分区、列、数据类型和表之间关系的信息。这使得用户可以在不了解底层数据存储结构的情况下查询数据。扩展性 Hive是高度可扩展的可以处理大规模数据集。它允许用户将数据表分成分区并支持分区级别的操作从而提高了查询性能。UDF用户定义函数 Hive允许用户编写自定义函数以满足特定的数据处理需求。这些自定义函数可以使用Java或Python编写并与HiveQL一起使用。集成 Hive可以与其他Hadoop生态系统工具集成如Hadoop MapReduce、Apache HBase、Apache Spark等。这意味着用户可以在不同的工具之间共享数据并执行复杂的数据处理任务。可视化工具 虽然Hive本身是一个命令行工具但也有许多可视化工具和商业智能平台如Tableau、QlikView支持Hive使用户能够使用图形界面进行数据分析和报告生成。安全性 Hive提供了基于SQL标准的权限管理机制以确保只有授权的用户可以访问和修改数据。数据格式支持 Hive支持多种数据格式包括文本、Parquet、ORCOptimized Row Columnar等可以根据需求选择最适合的格式。 核心的功能 元数据管理SQL解析 2 Hive部署 2.1 规划 Hive 是单机工具只需要部署在一台服务器即可。 Hive 虽然是单机的但是它可以提交分布式运行的 MapReduce 程序运行。 规划 我们知道 Hive 是单机工具后就需要准备一台服务器供 Hive 使用即可。 同时 Hive 需要使用元数据服务即需要提供一个关系型数据库我们也选择一台服务器安装关系型数据库即可 机器服务node1Hivenode1Mysql 2.2 安装软件 步骤1安装Mysql5.7 # 更新秘钥 rpm --import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022 # 安装mysql yum库 rpm -Uvh http://repo.mysql.com//mysql57-community-release-el7-7.noarch.rpm # yum安装mysql yum -y install mysql-community-server # 启动mysql systemctl start mysqld # 设置msyql开机自启 systemctl enable mysqld # 检查Mysql服务状态 systemctl status mysqld # 第一次启动mysql会在日志文件中生成root用户的一个随机密码 cat /var/log/mysqld.log | grep password 连接mysql 我们是做实验用设置简单密码生成中不要这样子搞 set global validate_password_policyLOW; set global validate_password_length4; alter user rootlocalhost identified by 123456; grant all privileges on *.* to root% identified by 123456 with grant option; flush privileges;步骤2配置Hadoop Hive的运行依赖HadoopHDFS、MapReduce、YARN都依赖同时涉及到HDFS文件系统的访问所有要配置Hadoop的代理用户即设置Hadoop用户允许代理模拟其他用户。 配置如下内容在Hadoop的core-site.xml中并分发到其他节点且重启HDFS集群 propertynamehadoop.proxyuser.hadoop.hosts/namevalue*/value /property propertynamehadoop.proxyuser.hadoop.groups/namevalue*/value /property步骤3下载解压Hive node1切换到hadoop用户 su - hadoop下载Hive安装包或者本地上传 http://archive.apache.org/dist/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz解压 tar -zxvf apache-hive-3.1.3-bin.tar.gz -C /export/server/设置软连接 ln -s /export/server/apache-hive-3.1.3-bin.tar.gz /export/server/hive步骤4提供Mysql 驱动包 下载或者上传Mysql驱动包 https:// repo1.maven.org/maven2/mysql/mysql-connector-java/5.1.34/mysql-connector-java-5.1.34.jar将下载好的Mysql驱动包移入Hive安装目录下lib目录内 mv mysql-connector-java-5.1.34.jar /export/server/hive/lib/步骤5配置Hive 在 Hive 的 conf 目录内新建 hive-env.sh 文件填入以下环境变量内容 export HADOOP_HOME/export/server/hadoop export HIVE_CONF_DIR/export/server/hive/conf export HIVE_AUX_JARS_PATH/export/server/hive/lib在 Hive 的 conf 目录内新建 hive-site.xml 文件填入以下内容 configurationpropertynamejavax.jdo.option.ConnectionURL/namevaluejdbc:mysql://node1:3306/hive?createDatabaseIfNotExisttrueuseSSLfalseuseUnicodetruecharacterEncodingUTF-8/value/propertypropertynamejavax.jdo.option.ConnectionDriverName/namevaluecom.mysql.jdbc.Driver/value/propertypropertynamejavax.jdo.option.ConnectionUserName/namevalueroot/value/propertypropertynamejavax.jdo.option.ConnectionPassword/namevalue123456/value/propertypropertynamehive.server2.thrift.bind.host/namevaluenode1/value/propertypropertynamehive.metastore.uris/namevaluethrift://node1:9083/value/propertypropertynamehive.metastore.event.db.notification.api.auth/namevaluefalse/value/property /configuration现在使用的是5.1.34 Mysq驱动包配置的连接驱动也是旧版废弃的 步骤6初始化元数据库 在Mysql数据库中新建数据库hive create database hive charset utf8;执行元数据库初始化命令 cd /export/server/hive bin/schematool -initSchema -dbType mysql -verbos打印 Initialization script completed schemaTool completed初始化完成 步骤7启动Hive 当前用户为hadoop 确保Hive文件夹所属为hadoop用户 创建hive日志文件夹 mkdir /export/server/hive/logs启动元数据管理服务 # 前台启动 bin/hive --service metastore # 后台启动 nohup bin/hive --service metastore logs/metastore.log 21 启动客户端二选一当前简单测试选择 Hive Shell Hive Shell方式可以直接写SQL /bin/hiveHive ThriftServer不可以直接写SQL需要外部客户端链接使用 bin/hive --service hiveserver23 Hive体验 首先确保启动了metastore服务可以执行 bin/hive 进入hive shell环境中可以执行SQL语句如下图所示 创建表 create table test(id int,name string,gender string);插入数据 insert into test values(1, 爱因斯坦, 男),(2, 麦克斯韦, 男),(3, 居里夫人, 女);查询数据 select gender, count(*) cnt from test group by gender;验证Hive的数据存储Hive的数据存储在HDFS的/user/hive/warehouse如下图所示 验证SQL语句启动的MapReduce程序打开YARN的WEB UI页面查看任务情况-http://node1:8088如下图所示 4 Hive客户端 4.1 HiveServer2 服务 在启动 Hive 的时候除了必备的 Metastore 服务外我们前面提过有 2 种方式使用 Hive • 方式 1 bin/hive 即 Hive 的 Shell 客户端可以直接写 SQL • 方式 2 bin/hive --service hiveserver2 后台执行脚本 nohup bin/hive --service hiveserver2 logs/hiveserver2.log 21 bin/hive --service metastore 启动的是元数据管理服务 bin/hive --service hiveserver2 启动的是 HiveServer2 服务 HiveServer2 是 Hive 内置的一个 ThriftServer 服务提供 Thrift 端口供其它客户端链接 可以连接 ThriftServer 的客户端有 • Hive 内置的 beeline 客户端工具命令行工具 • 第三方的图形化 SQL 工具如 DataGrip 、 DBeaver 、 Navicat 等 # 先启动 metastore 服务 然后启动 hiveserver2 服务 nohup bin/hive --service metastore logs/metastore.log 21 nohup bin/hive --service hiveserver2 logs/hiveserver2.log 21 4.2 DataGrip 我们这里以DataGrip为例其他客户端自行测试。 步骤1创建工程文件夹 E:\gaogzhen\projects\bigdata\DataGripProjects\hive-demo步骤2DataGrip创建新工程并关联本地文件夹 步骤3DataGrip连接Hive 1693897609904) 步骤4配置Hive JDBC驱动 连接成功如下图所示 5 问题集 5.1 Could not open client transport with JDBC Uri 报错内容 Error: Could not open client transport with JDBC Uri: jdbc:hive2://localhost:10000: Failed to open new session: java.lang.RuntimeException: org.apache.hadoop.security.AccessControlException: Permission denied: userroot, accessEXECUTE , inode/tmp:hadoop:supergroup:drwx------解决方案参考下面连接4修改hdfs /tmp访问权限前面我们配置了hadoop用户代理不知道为啥没生效 结语 如果小伙伴什么问题或者指教欢迎交流。 ❓QQ:806797785 参考链接: [1]大数据视频[CP/OL].2020-04-16. [2]0102阿里云配置3台ECS服务器-大数据学习[CP/OL]. [3]0201hdfs集群部署-hadoop-大数据学习[CP/OL]. [4]beeline连接hive2报错Permission denied[CP/OL].

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/89381.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

外贸设计网站建设网站建设创新成果

原创 | 文 BFT机器人 01 人机交互的新工具 在人机交互领域,来自欧洲各地的研究人员开发了一种名为HEUROBOX的新工具,用于评估交互。HEUROBOX提供了84个基本启发式和228个高级启发式,用于评估人机交互的各个方面,如安全性、人体工…

加强普法网站和普法网络集群建设关于建设工程资质网站

“更适合中国宝宝体质”的主题乐园,被泡泡玛特造出来了。 9月26日,位于北京朝阳公园内的国内首个潮玩行业沉浸式 IP 主题乐园,也是泡泡玛特首个线下乐园——泡泡玛特城市乐园 POP LAND正式开园。 约4万平方米的空间中,泡泡玛特使…

杭州网站建设优化推广网络推广学校

转载自:http://blog.sina.com.cn/s/blog_7571423b01016707.html 编程求解:输入两个整数 n 和 m ,从数列 1 , 2 , 3.......n 中随意取几个数 ,使其和等于 m , 要求将其中所有的可能组合列出来. 分析: 主要思…

手机网站微信支付代码陕西西安网站设计公司

在现代办公场景中,数据可视化的应用已经成为提高效率、推动创新的得力工具。无论是管理层还是普通员工,都能从数据可视化中受益匪浅。下面我就以可视化从业者的角度,简单聊聊这个话题。 首先,数据可视化提升了数据的易读性与理解性…

大学生做网站和做app深圳市住房和城乡建设部网站

VSS概述版本控制是工作组软件开发中的重要方面,它能防止意外的文件丢失、允许反追踪到早期版本、并能对版本进行分支、合并和管理。在软件开发和您需要比较两种版本的文件或找回早期版本的文件时,源代码的控制是非常有用的。Visual SourceSafe 是一种源代…

专业网站的建设设行吗温州网站建设和运营

java lambda循环对于每个经常需要在Java 8&#xff08;或更高版本&#xff09;中使用多维数组的人来说&#xff0c;这只是一个快速技巧。 在这种情况下&#xff0c;您可能经常会以类似于以下代码的结尾&#xff1a; float[][] values ... for (int i 0; i < values.leng…

服装网站 欣赏wordpress 媒体库无法打开

此片文章简单介绍布局管理的使用方法。通过实例先分别介绍分隔窗口QSplitter类、停靠窗口QDockWidget类及QStackedWidget类的使用&#xff0c;最后再通过一个实例介绍QLayout的使用。 分割窗口QSplitter类 分隔窗口可以灵活地布局窗口&#xff0c;可以用在文件资源管理器地窗…

写作网站哪个能得稿费网站编辑岗位

在当今数字化时代&#xff0c;云服务器作为企业级应用的核心设备&#xff0c;其性能和类型对于企业的运营和数据处理至关重要。在常见的香港云服务器类型中&#xff0c;通用型和计算型是最为常见的两种。那么&#xff0c;这两种云服务器到底有什么区别呢? 设计目标和应用场景不…

龙华网站建设招商做版权保护的网站

iPhone 15 是 Apple 最新、最出色的智能手机。它拥有时尚的设计、尖端的技术和众多功能&#xff0c;使其成为市场上最令人垂涎​​的设备之一。不幸的是&#xff0c;与所有智能手机一样&#xff0c;iPhone 14 容易发生可能导致屏幕破裂的事故和事故。破损的屏幕可能是毁灭性的&…

网站安全检测发生告警后邮局网站建设的目的

返回ABP系列 ABP是“ASP.NET Boilerplate Project (ASP.NET样板项目)”的简称。 ASP.NET Boilerplate是一个用最佳实践和流行技术开发现代WEB应用程序的新起点&#xff0c;它旨在成为一个通用的WEB应用程序框架和项目模板。 ABP的官方网站&#xff1a;http://www.aspnetboilerp…

电影频道做的网站广告广州网站建设公司小程序

1.对象内存图 1.1 Java 内存分配 1.2 堆和栈 栈:所有局部变量都会在栈内存中创建 局部变量&#xff1a;定义在方法中的变量或者方法声明上的变量 方法执行都会加载到栈中进行 -----------------------------------------------------------------------------------------…

怎么做品牌推广网站微信小程序跳转到网页

已知两个链表L1和L2分别表示两个集合&#xff0c;其中元素递增排列。请设计一个算法&#xff0c;用于求出L1与L2的交集&#xff0c;并存放在L1链表中。 代码思路&#xff1a; 我们创建一个辅助链表L3&#xff0c;用于存储L1和L2链表的交集&#xff0c;用s遍历L3各个元素 用p和…

芯片公司网站建设百度seo网站排名

文章目录 任务处理方式异步操作的优缺点async和awiatasyncawait使用 async/await 的注意事项示例 前言&#xff1a;此篇文章是在文心一言的辅助下完成的。 任务处理方式 同步操作&#xff1a;同步操作是指所有的操作都完成后&#xff0c;才返回给用户结果。当一个任务发出请求…

凡科网站怎么修改昨天做的网站c语言做网站吗

LeetCode每日一题 1944.队列中可以看到的人数 1944. 队列中可以看到的人数 - 力扣&#xff08;LeetCode&#xff09; 题目描述 有 n 个人排成一个队列&#xff0c;从左到右 编号为 0 到 n - 1 。给你以一个整数数组 heights &#xff0c;每个整数 互不相同&#xff0c;heig…

宿州集团网站建设做有关兼职网站的需求分析

顺序 : 从上向下&#xff0c; 顺序执行代码分支 : 根据条件判断&#xff0c; 决定执行代码的分支循环 : 让特定代码重复的执行

做logo有哪些网站负责网站的建设规划

MongoDB 面试题 1. 什么是MongoDB&#xff1f; MongoDB是一种非关系型数据库&#xff0c;被广泛用于大型数据存储和分布式系统的构建。MongoDB支持的数据模型比传统的关系型数据库更加灵活&#xff0c;支持动态查询和索引&#xff0c;也支持BSON格式的数据存储&#xff0c;这…

网站定位方案 资源新版在线天堂

给定一个只包括 (&#xff0c;)&#xff0c;{&#xff0c;}&#xff0c;[&#xff0c;] 的字符串 s &#xff0c;判断字符串是否有效。 有效字符串需满足&#xff1a; 左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。每个右括号都有一个对应的相同类型的左括…

网站seo推广员招聘来个网站好人有好报

一、计算机内存 1.1、计算机硬件内存架构。   计算机CPU&#xff08;central processing unit&#xff09;和内存的交互是最频繁的&#xff0c;内存是我们的高速缓存区。用户磁盘和CPU的交互&#xff0c;而CPU运转速度越来越快&#xff0c;磁盘远远跟不上CPU的读写速度&…

网站建设方案2000字免费永久域名申请注册

AD9371 系列快速入口 AD9371ZCU102 移植到 ZCU106 &#xff1a; AD9371 官方例程构建及单音信号收发 采样率和各个时钟之间的关系 &#xff1a; AD9371 官方例程HDL详解之JESD204B TX侧时钟生成 &#xff08;三&#xff09; 参考资料&#xff1a; UltraScale Architecture G…

营口建网站的公司wordpress输出标签下文章

在Python中&#xff0c;自然语言处理&#xff08;NLP&#xff09;和文本挖掘通常涉及对文本数据进行清洗、转换、分析和提取有用信息的过程。Python有许多库和工具可以帮助我们完成这些任务&#xff0c;其中最常用的包括nltk&#xff08;自然语言处理工具包&#xff09;、spaCy…