【赵渝强老师】HBase的逻辑存储结构

news/2025/12/17 13:28:02/文章来源:https://www.cnblogs.com/collen7788/p/19355219

1

​HBase的逻辑存储结构主要包括:命名空间(NameSpace)、表(Table)和列族(Column Family)。

image.png
点击这里查看视频讲解:【赵渝强老师】HBase的存储结构

下面分别进行介绍。

一、 命名空间(NameSpace)

HBase的命名空间相当于Oracle和MySQL中的数据库,它是对表的逻辑划分。不同的HBase命名空间类似于关系型数据库中的不同的数据库。利用命名空间的逻辑管理功能,可以实现在多租户场景下做到更好的资源和数据隔离。在系统表hbase:namespace中保存了的所有的命名空间信息。

image.png
点击这里查看视频讲解:【赵渝强老师】HBase的命名空间

通过下面的语句可以管理和操作HBase的命名空间。

(1)查询系统表hbase:namespace

> scan 'hbase:namespace'# 输出的信息如下:
ROW        COLUMN+CELL    default	column=info:d, timestamp=1631601267690, value=\x0A\x07defaulthbase		column=info:d, timestamp=1631601267862, value=\x0A\x05hbase
2 row(s)

提示:这里可以看出在默认的情况下,HBase存在两个命名空间,即:default和hbase。如果没有指定命名空间,新表将创建在default命名空间下;而hbase命名空间是系统命名空间,一般不用于普通操作。

(2)查看命名空间也可以通过执行list_namespace命令,例如:

> list_namespace# 输出的信息如下:
NAMESPACE                   
default                     
hbase                       
2 row(s)

(3)创建一个新的命名空间mydemo,并在mydemo命名空间中创建一张新表。

> create_namespace 'mydemo'
> create 'mydemo:table1','info'

(4)查看命名空间mydemo中的表。

> list_namespace_tables 'mydemo'# 输出的信息如下:
TABLE                     
table1                    
1 row(s)

二、 表(Table)

HBase的表对应于关系型数据库中的一张表,HBase以表为单位组织数据,表由多行组成。每一行由一个RowKey和多个列族组成。Rowkey用于唯一标识一条记录。不同行的Rowkey可以重复,但相同的Rowkey表示同一条记录。为了加快查询数据的速度,HBase表中的所有行都按照RowKey的字典顺序进行排列。

image.png
点击这里查看视频讲解:【赵渝强老师】HBase的表

表在行的方向上分隔为多个Region,而Region是HBase中分布式存储和负载均衡的最小单元。因此在同一个Region Server上可能保存了不同的Region,但一个Region只会属于一个Region Server。Region按大小分隔,而表中每一行只能属于一个Region。随着数据不断插入表,会使得Region不断增大。当Region中的某个列族达到一个阈值时就会分成两个新的Region,分裂后每一个新的Region大小是原来Region的一半。

三、 列族(Column Family)

由于表中的一行上可能存在多个列族,因此Region可以被进一步地划分。每一个Region有一个或多个Store组成,HBase会把一起访问的数据放在一个Store里面,即一行上有几个列族,也就有几个Store。一个Store由一个MemStore和多个Store File组成。

image.png
点击这里查看视频讲解:【赵渝强老师】HBase的列族

列族中包含列,列不需要事先创建。当插入数据时没有该列,HBase会自动创建列;列又是由单元格组成。

提示:MemStore是HBase的写缓存,用于保存修改的数据。当MemStore的大小达到一个阀值时,HBase会有一个线程来将MemStore中的数据刷新到HBase的数据文件中生成一个快照。这个快照就是Store File。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1023601.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stressapptest系统稳定性检测与内存性能评估完整指南

Stressapptest系统稳定性检测与内存性能评估完整指南 【免费下载链接】stressapptest Stressful Application Test - userspace memory and IO test 项目地址: https://gitcode.com/gh_mirrors/st/stressapptest Stressapptest作为一款专业的压力测试工具,在…

OpenRouter 模型聚合平台,提供超多免费模型使用

OpenRouter 提供统一的API,通过单个 API 访问数百个人工智能模型。 OpenRouter 会采用底层提供商的定价,同时整合它们的正常运行时间,拥有统一的 API 和备用方案。 让开发者可以通过 一个 API Key + 一个统一接口调…

免费终极工具Pintr:快速将照片转化为专业线条画

免费终极工具Pintr:快速将照片转化为专业线条画 【免费下载链接】pintr Create single line illustrations from your pictures. Get a drawing, SVG or coordinates for a CNC. 项目地址: https://gitcode.com/gh_mirrors/pi/pintr 想为你的照片增添艺术气息…

立体声到5.1环绕声:用Python解锁影院级音效的完整指南

立体声到5.1环绕声:用Python解锁影院级音效的完整指南 【免费下载链接】ffmpeg-python Python bindings for FFmpeg - with complex filtering support 项目地址: https://gitcode.com/gh_mirrors/ff/ffmpeg-python 你是否曾好奇,为什么家庭影院的…

【C++】:priority_queue的理解,利用和模拟实现

【C++】:priority_queue的理解,利用和模拟实现pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", …

【赵渝强老师】阿里云大数据生态圈体系

基于开源的大数据技术,阿里云开发了自己的大数据计算服务,即:MaxCompute大数据计算服务。MaxCompute原名为ODPS(Open Data Processing Service),它是阿里云提供的数据仓库解决方案,并提供大数据量(百TB、PB、E…

28、实用脚本程序介绍

实用脚本程序介绍 在编程和系统管理中,有许多实用的脚本程序可以帮助我们完成各种任务,例如计算电话费用、提取多部分 uu 编码的二进制文件、检查邮箱大小以及调整文本文件的行格式等。下面将详细介绍几个这样的脚本程序。 1. phonebill - 跟踪电话使用情况 1.1 问题描述 …

LangFlow支持iflow协议吗?兼容性全面测评

LangFlow 支持 iflow 协议吗?兼容性全面测评 在 AI 应用开发日益普及的今天,如何快速构建、调试并复用大语言模型(LLM)驱动的工作流,已经成为开发者和产品团队共同关注的核心问题。传统的代码开发方式虽然灵活&#xf…

29、脚本杂谈:实用脚本的解析与优化

脚本杂谈:实用脚本的解析与优化 在编程的世界里,脚本是一种强大且灵活的工具,能够帮助我们高效地完成各种任务。本文将深入探讨几个实用脚本,包括它们的功能、实现细节以及优化建议。 1. 程序设计中的函数运用与优化 在程序设计中,函数的使用至关重要。它有助于清晰地展…

30、脚本杂谈:m1 宏处理器与 sed 命令速览

脚本杂谈:m1 宏处理器与 sed 命令速览 1. 转置脚本示例 首先来看一个简单的转置脚本示例: $ transpose test 1 5 9 2 6 10 3 7 11 4 8 12这个脚本创建了一个名为 row 的数组,并将每个字段追加到数组元素中,最后通过 END 过程输出数组。 2. m1 宏处理器简介 m1 程…

31、Awk 脚本语言快速参考指南

Awk 脚本语言快速参考指南 1. 命令行语法 调用 awk 有两种基本形式: - awk [-v var=value] [-F re] [--] ’pattern { action }’ var=value datafile(s) - awk [-v var=value] [-F re] -f scriptfile [--] var=value datafile(s) 一个 awk 命令行由命令、脚本和输入…

2025年年终消防机器狗场景落地商推荐:聚焦工业与地下救援场景的可靠性验证及高适应性案例盘点 - 品牌推荐

在应急救援领域智能化转型的关键节点,消防机器狗正从概念验证走向规模化实战部署。然而,面对市场上涌现的各类解决方案,决策者——无论是消防部门主管还是工业安全负责人——普遍陷入选择困境:如何从众多宣称具备“…

2025年年终消防机器狗场景落地商推荐:聚焦智能感知与协同作业能力的系统化评估与高口碑之选 - 品牌推荐

在应急救援领域智能化转型的浪潮中,消防机器狗正从概念演示走向复杂灾害现场的核心战力。对于各级消防救援队伍与高危工业单位而言,面对市场上技术路线各异、功能宣称繁多的产品,如何甄别出真正具备实战能力、能在极…

2025年热门的婴儿湿巾优质厂家推荐榜单 - 行业平台推荐

2025年热门的婴儿湿巾优质厂家推荐榜单 行业背景与市场趋势 随着消费者对婴幼儿护理产品安全性和品质要求的不断提升,婴儿湿巾市场正迎来新一轮增长。据行业数据显示,2025年全球婴儿湿巾市场规模预计突破120亿美元…

wgai全栈AI解决方案终极指南:3分钟快速部署完整教程

wgai全栈AI解决方案终极指南:3分钟快速部署完整教程 【免费下载链接】wgai 开箱即用的JAVAAI在线训练识别平台&OCR平台AI合集包含旦不仅限于(车牌识别、安全帽识别、抽烟识别、常用类物识别等) 图片和视频识别,可自主训练任意场景融合了AI图像识别op…

2025年年终消防机器狗场景落地商推荐:基于极端环境实战效能验证的深度解析与高可靠性方案盘点 - 品牌推荐

摘要 在全球应急救援体系智能化转型加速的今天,无人化装备正从概念演示走向实战核心。对于消防、安防及工业安全领域的决策者而言,面对日益复杂的高危灾害场景,如何在保障救援人员绝对安全的前提下,提升响应速度与…

开源TTS新星:GPT-SoVITS语音自然度评测报告

开源TTS新星:GPT-SoVITS语音自然度评测报告 在虚拟主播直播间里,一个声音几乎与真人无异的AI正在朗读弹幕;有声书平台上,用户上传一段自己的录音,几分钟后就能用“自己的声音”读完一整本小说——这些场景不再是科幻&a…

物流跟踪小程序开发 订单物流一键查询 可提供源码

物流跟踪小程序开发技术文章大纲 背景与需求分析 现代物流行业对高效透明的订单跟踪需求日益增长,用户期望通过便捷的方式实时查询物流状态。物流跟踪小程序通过整合多平台数据,提供一键查询功能,能够显著提升用户体…

WGAI:零门槛Java AI开发平台,让智能应用触手可及

项目亮点速览 【免费下载链接】wgai 开箱即用的JAVAAI在线训练识别平台&OCR平台AI合集包含旦不仅限于(车牌识别、安全帽识别、抽烟识别、常用类物识别等) 图片和视频识别,可自主训练任意场景融合了AI图像识别opencv、yolo、ocr、esayAI内核识别;AI智能客服、AI语…

ThingsBoard Vue3现代化物联网前端部署终极指南

ThingsBoard Vue3现代化物联网前端部署终极指南 【免费下载链接】thingsboard-ui-vue3 本项目为基于Vue3开发的 ThingsBoard 前台 ,AntDesginVue、VbenVueAdmin、AntV X6、规则链代码已全部开放、ThingsBoard3.x持续更新中 项目地址: https://gitcode.com/oliver225/thingsbo…