介绍一下TiDB、RocksDb、levelDB、LSM 树、SSTable。

LSM 树(Log-Structured Merge-Tree)

  • 核心原理:通过将随机写转换为顺序写优化写入性能,适用于写密集型场景。数据首先写入内存中的 MemTable(有序结构,如跳表),当达到阈值后转为 Immutable MemTable,再刷入磁盘形成 SSTable。通过分层合并(Compaction)清理冗余数据。
  • 关键特点
    • 写放大:合并操作可能导致重复写入,但顺序写优势显著(如机械盘顺序写性能是随机写的千倍)。
    • 读放大:需从内存到多层级磁盘文件逐层查找,但通过布隆过滤器和索引优化。
    • 分层结构:数据从高层(热数据)到低层(冷数据)逐步下沉,低层容量按指数级增长(如每层容量是上一层的10倍)。

SSTable(Sorted String Table)

  • 定义:磁盘上的有序键值文件,不可变且全局有序(除Level 0外),每个文件包含数据块、索引块和布隆过滤器。
  • 优化手段
    • 索引加速:通过稀疏索引快速定位数据块。
    • 布隆过滤器:减少无效磁盘I/O,判断键是否存在于文件中。
    • 压缩:使用Snappy/ZSTD等算法减少存储空间和传输带宽。

LevelDB

  • 定位:Google开源的轻量级单机KV存储引擎,基于LSM树。
  • 核心设计
    • 内存结构:Active MemTable(写入口)和Immutable MemTable(待刷盘)。
    • Compaction策略:分层合并,Level 0允许文件间Key重叠,其他层级全局有序。
    • 限制:单线程Compaction、无多版本控制,适合嵌入式或小规模场景。
  • 典型应用:Chrome浏览器本地存储、轻量级NoSQL场景。

RocksDB

  • 定位:Facebook优化的LevelDB升级版,支持企业级高并发和大数据量。
  • 关键优化
    • 并行Compaction:多线程加速合并,降低写停顿。
    • 冷热分离:热数据优先保留在低层,冷数据下沉至高层。
    • 灵活配置:支持多种压缩算法、速率限制、TTL等。
    • 增量备份:支持Checkpoint和增量快照。
  • 应用场景:MySQL底层存储(如TiDB)、分布式系统(如CockroachDB)、消息队列(如Kafka的RocksDB状态存储)。

TiDB

  • 定位:国产分布式HTAP数据库,兼容MySQL协议,底层存储基于RocksDB。
  • 架构组件
    • TiKV:分布式KV存储引擎,数据按Region分片,基于Raft协议保证一致性。
    • PD(Placement Driver):全局调度器,管理元数据、负载均衡和故障恢复。
    • TiSpark:集成Spark处理复杂OLAP查询。
  • 核心优势
    • 水平扩展:通过添加节点实现计算和存储分离扩容。
    • HTAP能力:行存(TiKV)支持OLTP,列存(TiFlash)支持OLAP。
    • 金融级可靠性:支持分布式事务(Percolator协议)和多副本强一致。

对比与关联

维度LevelDBRocksDBTiDB
架构单机嵌入式单机/分布式扩展分布式HTAP
Compaction单线程,分层合并多线程,冷热分离基于RocksDB,Region分片
适用场景小规模、低并发高吞吐、企业级存储大规模OLTP+OLAP混合负载
核心优化基础LSM实现多级缓存、速率控制全局调度、行列混存

典型应用场景

  1. LSM树:写密集型场景(日志存储、时序数据)。
  2. LevelDB:浏览器本地存储、小型嵌入式系统。
  3. RocksDB:分布式数据库底层引擎(如TiKV)、消息队列状态存储。
  4. TiDB:金融级分布式事务(如支付系统)、实时分析(如电商大促监控)。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/898486.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ESP32 BLE 初步学习笔记

前言 蓝牙作为一个庞大的知识体系,其学习和运用对于初学者来说显得有些复杂且凌乱。我整理了这段时间的学习笔记,涵盖了协议栈、工作流程、参数等内容。在实际应用中,我们主要使用 GAP 和 GATT,协议栈中的其他部分只需了解即可。…

dfs(二十四)47. 全排列 II

47. 全排列 II 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 示例 1: 输入:nums [1,1,2] 输出: [[1,1,2],[1,2,1],[2,1,1]]示例 2: 输入:nums [1,2,3] 输出:[[1,…

代码随想录算法训练营第五十二天 |101. 孤岛的总面积102. 沉没孤岛103. 水流问题104.建造最大岛屿

101. 孤岛的总面积 卡码网:101. 孤岛的总面积(opens new window) 题目描述 给定一个由 1(陆地)和 0(水)组成的矩阵,岛屿指的是由水平或垂直方向上相邻的陆地单元格组成的区域,且完全被水域单…

Simple-BEV的bilinear_sample 作为view_transformer的解析,核心是3D-2D关联点生成

文件路径models/view_transformers 父类 是class BiLinearSample(nn.Module)基于https://github.com/aharley/simple_bev。 函数解析 函数bev_coord_to_feature_coord的功能 将鸟瞰图3D坐标通过多相机(针孔/鱼眼)内外参投影到图像特征平面&#xff0…

A/B测试入门指南

目录 一、什么是A/B测试1.1 A/A测试1.2 多变量测试 二、A/B测试应用场景三、A/B测试基本流程四、A/B测试面试真题4.1 【是什么】4.2 【为什么】4.3 【怎么做】 五、应用实战 一、什么是A/B测试 A/B 测试是一种常见的实验方法,用于比较两个或多个方案的效果&#xff…

自己构建的交叉编译器找不到PATH_MAX

接上篇centos6.10 编译gcc11.5 x64到aarch64交叉工具链 -CSDN博客 PATH_MAX找不到,不仅在编译gcc的过程中遇到,而且临时改gcc源码添加#define PATH_MAX 4096 宏定义后勉强通过gcc全量编译。这个新的gcc编译使用了PATH_MAX宏的代码还是会找不到。这个问题…

vscode查看文件历史git commit记录

方案一:GitLens 在vscode扩展商店下载GitLens 选中要查看的文件,vscode界面右上角点击GitLens的图标,选择Toggle File Blame 界面显示当前打开文件的所有修改历史记录 鼠标放到某条记录上,可以看到记录详情,选中O…

ngx_http_conf_ctx_t

定义在 src/http/ngx_http_config.h typedef struct {void **main_conf;void **srv_conf;void **loc_conf; } ngx_http_conf_ctx_t; ngx_http_conf_ctx_t 是 Nginx 中用于管理 HTTP 配置上下文的核心结构体,其设计体现了 Nginx 多级配置&…

IREE AI编译器编译测试流程指南

iree onnx demo 计划协议系列博客,记录学习iree编译器的过程. 今天第一篇博客,记录安装和测试iree 文章目录 iree onnx demo下载安装ireepython环境安装编译测试1. [前端] onnx模型转MLIR文件2. [后端] MLIR文件转可执行文件3. [执行] 执行测试编译后的文件 关于后端设备的介…

【产品小白】如何运营一个新的产品

运营一个新产品既充满机遇,也伴随着挑战。新产品运营的核心在于快速获取用户、验证市场假设、持续迭代与优化,并通过有效的推广和用户反馈机制不断完善产品。 1. 市场调研与定位 用户调研:在产品初期,通过访谈、问卷、竞品分析等…

破解验证码新利器:基于百度OCR与captcha-killer-modified插件的免费调用教程

破解验证码新利器:基于百度OCR与captcha-killer-modified插件的免费调用教程 引言 免责声明: 本文提供的信息仅供参考,不承担因操作产生的任何损失。读者需自行判断内容适用性,并遵守法律法规。作者不鼓励非法行为,保…

JSON 解析中需要清理的危险字符

在代码中 replace(chr(0), "") 的作用是删除 JSON 响应中可能存在的空字符(Null character)。以下是详细解释: 1. chr(0) 是什么? chr(0) 表示 ASCII 码为 0 的字符,即空字符(Null Character&am…

指令系统2(Load/Store 指令)

一. Load/Store 指令 1. 前变址 前变址指令是在读取或存储数据时,先根据基址寄存器(Rn)与偏移量(offset)计算出有效地址,再进行数据操作。相关指令及示例如下: LDR R0, [R1, #4]:从…

ubuntu部署运行xinference全精度对话deepseek本地部署图文教程

前置环境搭建劳请移步往期 source activate 自己环境名启动python3.12环境安装xinference, 按教程敲命令,wheel包与wsl的通用,pip install 包名。 vllm引擎,transform引擎也会顺带自动装上了。 后续操作请参照往期教程。本地部署模…

技术分享 | MySQL内存使用率高问题排查

本文为墨天轮数据库管理服务团队第51期技术分享,内容原创,如需转载请联系小墨(VX:modb666)并注明来源。 一、问题现象 问题实例mysql进程实际内存使用率过高 二、问题排查 2.1 参数检查 mysql版本 :8.0.…

[AI速读]混合语言IP集成:挑战与高效解决方案

在现代SoC(系统级芯片)设计中,IP(知识产权模块)复用是提升开发效率的关键。然而,当设计涉及多种硬件描述语言(如SystemVerilog、VHDL、SystemC)时,如何高效集成不同语言的IP模块成为一大难题。本文将从实际设计场景出发,探讨混合语言IP集成的核心挑战,并介绍一套方法…

【vulhub/wordpress靶场】------获取webshell

1.进入靶场环境: 输入:cd / vulhub / wordpress / pwnscriptum 修改版本号: vim docker-compose.yml version: 3 保存退出 开启靶场环境: docker - compose up - d 开启成功,docker ps查看端口 靶场环境80…

微信小程序:用户拒绝小程序获取当前位置后的处理办法

【1】问题描述: 小程序在调用 wx.getLocation() 获取用地理位置时,如果用户选择拒绝授权,代码会直接抛出错误。如果再次调用 wx.getLocation() 时,就不会在弹窗询问用户是否允许授权。导致用户想要重新允许获取地理位置时&#x…

NLP 与常见的nlp应用

自然语言处理(NLP)是一个广泛的领域,它不仅包括自然语言理解(NLU),还涉及一系列其他任务和子领域。以下是NLP领域中的主要组成部分及其相关任务: 1. 自然语言理解(NLU) …

全网首创/纯Qt/C++实现国标GB28181服务/实时视频/云台控制/预置位/录像回放和下载/事件订阅/语音对讲

一、前言说明 用纯Qt来实现这个GB28181的想法很久了,具体可以追溯到2014年,一晃十年都过去了,总算是整体的框架和逻辑都打通了,总归还是杂七杂八的事情多,无法静下心来研究具体的协议,最开始初步了解协议后…