堆(Heap)

1. 堆(Heap)

1.1. Python实现堆的插入、堆顶删除和排序

class MaxHeap:def __init__(self):# 初始化空堆,使用列表表示self.heap = []def insert(self, val):# 插入元素并执行上浮self.heap.append(val)self._sift_up(len(self.heap) - 1)def delete(self):# 删除并返回堆顶元素if not self.heap:return Noneself._swap(0, len(self.heap) - 1)max_val = self.heap.pop()self._sift_down(0)return max_valdef build_heap(self, arr):# 从任意数组构建大顶堆self.heap = arr[:]for i in range((len(self.heap) - 2) // 2, -1, -1):self._sift_down(i)def heapsort(self):# 原地堆排序(不会额外开辟空间)n = len(self.heap)# 先构建堆for i in range((n - 2) // 2, -1, -1):self._sift_down(i)# 每次把最大值(堆顶)放到末尾,然后缩小堆范围for end in range(n - 1, 0, -1):self._swap(0, end)self._sift_down(0, end)def _sift_up(self, idx):# 上浮操作,保持堆结构parent = (idx - 1) // 2while idx > 0 and self.heap[idx] > self.heap[parent]:self._swap(idx, parent)idx = parentparent = (idx - 1) // 2def _sift_down(self, idx, size=None):# 下沉操作,保持堆结构(可传入范围用于排序)if size is None:size = len(self.heap)while True:largest = idxleft = 2 * idx + 1right = 2 * idx + 2if left < size and self.heap[left] > self.heap[largest]:largest = leftif right < size and self.heap[right] > self.heap[largest]:largest = rightif largest == idx:breakself._swap(idx, largest)idx = largestdef _swap(self, i, j):# 辅助函数:交换堆中两个元素self.heap[i], self.heap[j] = self.heap[j], self.heap[i]def __str__(self):# 返回堆内容的字符串表示return str(self.heap)
import heapqdef heapsort_asc(iterable):heap = []for value in iterable:heapq.heappush(heap, value)  # 构建最小堆return [heapq.heappop(heap) for _ in range(len(heap))]  # 升序弹出# 示例
nums = [7, 2, 5, 3, 1]
print("升序堆排序结果:", heapsort_asc(nums))

1.2. 堆的定义

1. 堆的基本概念

  • 是一种特殊的树形数据结构,广泛应用于算法中,如堆排序。
  • 堆的两个主要特征
  1. 完全二叉树:除了最后一层,其他层的节点都已满,最后一层的节点靠左排列。
  2. 节点值的大小关系

        大顶堆(Max-Heap):每个节点的值都大于或等于其子节点的值。

        小顶堆(Min-Heap):每个节点的值都小于或等于其子节点的值。

2. 堆的实现与存储

  • 堆通常使用数组来存储,因为完全二叉树的结构适合用数组表示。
  • 对于列表下标为 i 的节点:

左子节点下标:2i + 1

右子节点下标:2i + 2

父节点下标:i -1 // 2

1.3. 堆的核心操作

完全二叉树比较适合用数组来存储。用数组来存储完全二叉树是非常节省存储空间的。因为我们不需要存储左右子节点的指针,单纯地通过数组的下标,就可以找到一个节点的左右子节点和父节点。

具体python代码见5.1,以大顶堆为例。

1. 往堆中插入一个元素

  • 将新元素插入堆的最后,然后进行堆化(Heapify)操作来恢复堆的性质。
  • 堆化分为两种方式:

自下而上堆化:从插入的节点开始,依次与父节点比较,直到堆的性质恢复。

2. 删除堆顶元素

删除堆顶元素(最大或最小)后,将最后一个元素移动到堆顶,并进行自上而下堆化来恢复堆的性质。

时间复杂度:

一个包含 n个节点的完全二叉树,树的高度不会超过 log2n。堆化的过程是顺着节点所在路径比较交换的,所以堆化的时间复杂度跟树的高度成正比,也就是 O(logn)。插入数据和删除堆顶元素的主要逻辑就是堆化,所以,往堆中插入一个元素和删除堆顶元素的时间复杂度都是 O(logn)

3. 堆排序

堆排序的过程大致分解成两个大的步骤,建堆排序

建堆:

  • 将数组构建成一个堆。
  • 可以从前往后逐个插入元素构建堆(自下而上堆化)。
  • 或者从后往前处理,使用自上而下堆化的方式来构建堆。

排序:

每次将堆顶元素(最大或最小)与最后一个元素交换,将堆的大小减小 1,然后进行堆化。重复此过程直到数组排序完成。

不是稳定的排序算法。

时间复杂度分析:

建堆:

虽然每个节点堆化的时间复杂度为 O(log n),但由于堆的层数递减,因此建堆的时间复杂度是 O(n)

排序:

每次删除堆顶元素并堆化的时间复杂度为 O(log n),重复此过程 n 次,因此堆排序的总时间复杂度是 O(n log n)

快速排序 vs 堆排序:性能对比表(实际开发视角)

对比维度

快速排序(Quick Sort)

堆排序(Heap Sort)

数据访问模式

局部顺序访问:访问相邻元素,缓存友好

非顺序访问:跳跃式访问(如下标 1 → 2 → 4 → 8),缓存不友好

缓存命中率

高(连续访问内存,有利于 CPU 缓存预取)

低(访问分散,频繁触发缓存未命中)

数据交换次数

相对较少,尤其在数据部分有序的情况下

多:建堆过程中频繁打乱已有顺序,导致额外的交换

对初始有序性敏感

是(部分有序时性能更好

否(建堆打乱顺序

排序过程破坏有序度

否,尽量保持已有的顺序结构

是,建堆导致已有顺序被打乱

1.4. 堆的应用

1. 优先级队列(Priority Queue)

定义:

  • 与普通队列不同,出队顺序按优先级高低而非 FIFO。
  • 堆可高效实现优先级队列:

                插入元素:O(logn)

                取出优先级最高元素(堆顶):O(logn)

应用示例:

合并有序小文件:

  • 场景:将 100 个 100MB 的有序小文件合并为一个大文件。
  • 方案:

        每个文件取一个字符串放入小顶堆。

        每次从堆顶取最小值写入结果文件,再从对应文件中取下一个值加入堆。

        时间复杂度大幅优于线性遍历(数组)。

高性能定时器:

  • 维护很多任务,每个任务有执行时间。
  • 传统方法每秒轮询扫描任务表,低效。
  • 使用小顶堆优化:

                堆顶存放最早执行的任务

                定时器睡眠到该任务执行时间,节省资源。

                每次取堆顶更新下一次唤醒时间。

2. 利用堆求 Top K 问题

Top K 分为两类:

静态 Top K(一次性获取):

  • 使用K 大小的小顶堆
  • 遍历整个数组:

             若当前元素 > 堆顶:替换堆顶,重新堆化。

  • 时间复杂度:O(nlogK)

动态 Top K(实时查询):

  • 维护一个固定大小为 K 的小顶堆。
  • 插入新数据时:

        若新数据 > 堆顶:替换堆顶。

        否则忽略。

  • 查询时直接返回堆中元素。

3. 利用堆求中位数(及任意百分位数据)

静态数据集合:

  • 可直接排序取中位数,代价高但结果固定。

动态数据集合:

  • 方法:双堆法

        大顶堆(max-heap):存前半部分数据。

        小顶堆(min-heap):存后半部分数据,且小顶堆中的数据都大于大顶堆中的数据。

        保持两个堆平衡(大小相差不超过1)。

        中位数取决于两个堆的堆顶元素。

优势:

  • 每次插入数据后,只需调整两个堆即可,效率高。
  • 实现实时获取中位数,时间复杂度约为 O(logn)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/83187.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring类

BeanDefinition BeanDefinition表示Bean定义&#xff0c;BeanDefinition中存在很多属性用来描述一个Bean的特点。比如&#xff1a; class&#xff0c;表示Bean类型scope&#xff0c;表示Bean作用域&#xff0c;单例或原型等lazyInit&#xff1a;表示Bean是否是懒加载initMeth…

在vue中this.$emit有哪些作用,事件监控具体含义,以及这些子组件能封装哪些功能组件

this.$emit 的作用 this.$emit 的作用是触发一个自定义事件&#xff0c;并将数据传递给父组件。父组件可以通过 v-on&#xff08;或 &#xff09;监听这个事件&#xff0c;并在事件触发时执行相应的处理函数。 this.content 的作用 this.content 是子组件的 props&#xff0…

前端流行框架Vue3教程:16. 组件事件配合`v-model`使用

组件事件配合v-model使用 如果是用户输入&#xff0c;我们希望在获取数据的同时发送数据配合v-model 来使用&#xff0c;帮助理解组件间的通信和数据绑定。 &#x1f9e9; 第一步&#xff1a;创建子组件&#xff08;SearchComponent.vue&#xff09; 这个组件用于处理用户的搜…

《Navicat之外的新选择:实测支持国产数据库的SQLynx核心功能解析》

数据库工具生态的新变量 在数据库管理工具领域&#xff0c;Navicat长期占据开发者心智。但随着国产数据库崛起和技术信创需求&#xff0c;开发者对工具的兼容性、轻量化和本土化适配提出了更高要求。近期体验了一款名为SQLynx的国产数据库管理工具&#xff08;麦聪旗下产品&am…

AgenticSeek开源的完全本地的 Manus AI。无需 API,享受一个自主代理,它可以思考、浏览 Web 和编码,只需支付电费。

​一、软件介绍 文末提供程序和源码下载 AgenticSeek开源的完全本地的 Manus AI。无需 API&#xff0c;享受一个自主代理&#xff0c;它可以思考、浏览 Web 和编码&#xff0c;只需支付电费。这款支持语音的 AI 助手是 Manus AI 的 100% 本地替代品 &#xff0c;可自主浏览网页…

vue3.0的name属性插件——vite-plugin-vue-setup-extend

安装 这个由于是在开发环境下的一个插件 帮助我们支持name属性 所以需要是-D npm i vite-plugin-vue-setup-extend -D在pasckjson中无法注释每个插件的用处 可以在vscode中下载一个JsonComments这样可以在json中添加注释方便日后维护和查阅API 引入 在vite.config.js中 im…

Linux基础 -- 在内存中使用chroot修复eMMC

Linux基础 – 在内存中使用chroot修复eMMC 概述 本教程将介绍如何在Linux系统中&#xff0c;使用chroot在内存中构建一个临时系统&#xff0c;并在不依赖原有系统的情况下修复eMMC&#xff08;如/dev/mmcblk2&#xff09;磁盘。该方法适用于嵌入式系统修复、磁盘清理以及离线…

人工智能、深度学习、机器学习的联系与区别

定义 人工智能&#xff08;AI - Artificial Intelligence&#xff09; &#xff1a;是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它旨在让计算机能够像人类一样思考、学习和决策&#xff0c;涉及到诸如计算机视觉、自然语言处理…

web第二次课后作业--设计一个注册登录系统

一、页面展示 登录页面 提交页面 二、代码 2.1 登录页面 <% page language"java" contentType"text/html; charsetUTF-8"pageEncoding"UTF-8"%><html> <head><meta http-equiv"Content-Type" content"…

电脑桌面便签哪个好?2025年电脑免费用的便签软件推荐

我们都知道&#xff0c;一个优秀的桌面便签软件可以成为提高效率的得力助手。无论是记录临时灵感、管理待办事项&#xff0c;还是提醒重要日程&#xff0c;合适的便签工具都能让您的数字生活更加有序。本文将为您介绍2025年最值得推荐的免费电脑桌面便签软件&#xff0c;从Wind…

【SPIN】用Promela验证顺序程序:从断言到SPIN实战(SPIN学习系列--2)

你写了一段自认为“天衣无缝”的程序&#xff0c;但如何确保它真的没有bug&#xff1f;靠手动测试&#xff1f;可能漏掉边界情况&#xff1b;靠直觉&#xff1f;更不靠谱&#xff01;这时候&#xff0c;Promela SPIN组合就像程序的“显微镜”——用形式化验证技术&#xff0c;…

LabVIEW中样条插值实现及应用

在 LabVIEW 编程环境下&#xff0c;B - 样条插值是处理数据拟合与曲线平滑的重要工具。它凭借灵活的特性和良好的数学性质&#xff0c;在众多工程领域中发挥着关键作用&#xff0c;能够高效地根据离散数据点生成平滑连续的曲线&#xff0c;为数据分析和处理提供了有力支持。 一…

【油藏地球物理正演软件ColchisFM】基于数据驱动的油藏参数叠前地震反演研究进展

科吉思基于油藏地球物理参数的正演软件ColchisFM&#xff0c;有机融合了岩石物理正演与地震正演&#xff0c;具有良好的适用性和便捷性&#xff0c;在业内已经广泛使用。当用户在做正演模拟的同时&#xff0c;自然会联想到是否可以直接开展油藏地球物理参数反演呢&#xff1f;答…

互联网大厂Java求职面试:AI与大模型集成的云原生架构设计

互联网大厂Java求职面试&#xff1a;AI与大模型集成的云原生架构设计 引言 在现代互联网企业中&#xff0c;AI与大模型技术的应用已经成为不可或缺的一部分。特别是在短视频平台、电商平台和金融科技等领域&#xff0c;如何高效地将大模型集成到现有的云原生架构中是一个巨大…

Web GIS可视化地图框架Leaflet、OpenLayers、Mapbox、Cesium、ArcGis for JavaScript

Mapbox、OpenLayers、Leaflet、ArcGIS for JavaScript和Cesium是五种常用的Web GIS地图框架&#xff0c;它们各有优缺点&#xff0c;适用于不同的场景。还有常见的3d库和高德地图、百度地图。 1. Mapbox 官网Mapbox Gl JS案列&#xff1a;https://docs.mapbox.com/mapbox-gl-…

专项智能练习(加强题型)-DA-02

2. 单选题 近年来&#xff0c;“斜杠青年”成为很多人的时尚追求。它指的是一群不再满足“专一职业”生活方式&#xff0c;而选择拥有多重职业和身份的多元生活人群。对此&#xff0c;有人认为&#xff0c;新产业新技术新业态不断更迭&#xff0c;激烈的竞争促使青年人不断进行…

使用gitbook 工具编写接口文档或博客

步骤一&#xff1a;在项目目录中初始化一个 GitBook 项目 mkdir mybook && cd mybook git init npm init -y步骤二&#xff1a;添加书籍结构&#xff08;如 book.json, README.md&#xff09; echo "# 我的书" > README.md echo "{}" > bo…

Malformed input or input contains unmappable characters解决

JDK 17 文件上传编码异常解决方案技术文档 1. 问题背景 在 JDK 17 环境下&#xff0c;文件上传过程中可能抛出 Malformed input or input contains unmappable characters 错误。此问题通常由以下原因触发&#xff1a; 文件路径/名称包含非 ASCII 字符&#xff08;如中文、日…

MyBatis 的分页插件 c

前言 大型项目的数据体量很大&#xff0c;在前端界面展示时为保障展示效果&#xff0c;会要求接口快速返回&#xff0c;这时候后端会选择分页获取数据&#xff0c;只传递要查询的页码数据。这就避免了大多问题&#xff0c;达到快速返回的效果。 常用的分页有2种&#xff1a; …

Linux:理解文件系统

1.理解硬件 1.1磁盘 机械磁盘是计算机中的⼀个机械设备 磁盘--- 外设 慢 容量⼤&#xff0c;价格便宜 1.2磁盘物理结构 1.3磁盘的存储结构 扇区&#xff1a;是磁盘存储数据的基本单位&#xff0c;512字节&#xff0c;块设备 如何定位⼀个扇区呢&#xff1f; 确定磁头要访…