一、概述
Apache Hive是一款分布式SQL计算的工具, 其主要功能是:
将SQL语句翻译成MapReduce程序运行
Hive是单机工具,只需要部署在一台服务器即可。
Hive虽然是单机的,但是它可以提交分布式运行的MapReduce程序运行。
二、基本逻辑简介
主要由两大模块组成:元数据管理,SQL解析器

1、元数据管理

即:数据位置信息、数据结构信息、对数据进行描述与记录
2、SQL解析器
主要功能:
SQL分析SQL到MapReduce程序的转换- 提交
MapReduce程序运行并收集执行结果
3、简单流程图

三、基础架构

- 元数据管理,称之为
Metastore服务

SQL解析器(Driver驱动程序),完成SQL解析、执行优化、代码提交等功能

- 用户接口:提供用户和
Hive交互的功能
