【Python 数据结构 15.哈希表】

目录

一、哈希表的基本概念

1.哈希表的概念

2.键值对的概念

3.哈希函数的概念

4.哈希冲突的概念

5.常用的哈希函数

Ⅰ、直接定址法

Ⅱ、平方取中法

Ⅲ、折叠法

Ⅳ、除留余数法

Ⅴ、位与法

6.哈希冲突的解决方案

Ⅰ、开放定址法

Ⅱ、链地址法

7.哈希表的初始化

8.哈希表的元素插入

9.哈希表的元素删除

10.哈希表的元素查找

二、Python中的哈希表

1.哈希表的创建(字典)

2.哈希表的元素修改

Ⅰ、元素的索引

Ⅱ、元素的添加

Ⅲ、元素的删除

Ⅳ、元素的修改

3.哈希表的查找与遍历

Ⅰ、通过键查找值

Ⅱ、遍历哈希表的键

Ⅲ、遍历哈希表的值

Ⅳ、遍历哈希表的键和值 

三、代码实战

1512. 好数对的数目

方法一、哈希表

思路与算法

方法二、二重循环

思路与算法

961. 在长度 2N 的数组中找出重复 N 次的元素

方法一、哈希表

思路与算法

​编辑

1207. 独一无二的出现次数

方法一 哈希表

思路与算法


你每次都会自己站起来,这次又怎会是意外

                                                                —— 25.3.13

一、哈希表的基本概念

1.哈希表的概念

        哈希表又叫散列表,我们需要把查找的数据通过一个函数映射,找到存储数据的位置,这个过程被称为哈希。需要查找的数据本身被称为关键字,通过一个函数映射将关键字变成哈希值的过程,这里的函数被称为哈希函数

        生成哈希值的过程可能产生冲突(两个关键字通过一个哈希函数后得到的哈希值相同),需要进行冲突解决,解决完冲突以后,实际存储数据的位置被称为哈希地址。通俗的说,它就是一个数组下标存储所有这些数据的表,就被称为哈希表

        为了方便索引,哈希表底层实现结构是一个顺序表,每个位置被称为一个槽,存储一个键值对。以下就是一个长度为 8 的哈希表:


2.键值对的概念

        键值对由组成,键和值都可以是任意类型(比如整型、浮点型、字符串、类 等等)。

        哈希表的实现过程中,我们需要通过一些手段将一个非整型的键转换成整数,也就是哈希值,从而通过 O(1) 的时间快速索引到它对应在哈希表中的位置。而将一个非整形的关键字转换成整型的手段,就是哈希函数


3.哈希函数的概念

        哈希函数可以理解为小学课本上的那个函数 y=f(x),这里的 f(x) 就是哈希函数。x 是键,y 是哈希值。好的哈希函数应该具备两个特征:(1)单射 (2)雪崩效应

        单射:哈希值 y 与 键 x 一一对应

        雪崩效应:为了让哈希值,更加符合随机分布的原则,哈希表中的键分布的越随机,利用率越高,效率也越高。


4.哈希冲突的概念

        哈希函数在生成哈希值的过程中,如果不同的关键字传入哈希函数后得到相同的哈希值,就被称为 哈希冲突


5.常用的哈希函数

Ⅰ、直接定址法

        直接定址法就是:键本身就是哈希值,表示成函数就是 f(x) = x,例如计数排序的原理,采用的就是直接定址法。由于哈希值是需要映射到顺序表中作为索引的,所以直接定址法只能处理数据量较小的且为非负整数的键。

Ⅱ、平方取中法

        平方取中法就是对键进行平方运算,再取中间的某几位作为哈希值例如:对于键 1314 平方后得到 1726596,取中间三位作为哈希值,即 265。平方取中法比较适合于不清楚键的分布,且位数不是很大的情况。

Ⅲ、折叠法

        折叠法是将关键字分割成位数相等的几部分,然后再进行求和,得到一个哈希值。例如:对于关键字 5201314,将它分为四组,并且相加得到52+01+31+4=88,这个就是哈希值。

Ⅳ、除留余数法

        除留余数法,就是 键的值上哈希表长度,表示成函数 f(x) = x mod m,其中 m 代表了哈希表的长度。这种方法,不仅可以对关键字取模,也可以在平方取中法、折叠法之后再取模。

        例如:对于一个长度为 4 的哈希表,可以将关键字 模4 得到哈希值。而这个方法也是我们要重点介绍的方法。

Ⅴ、位与法

        哈希表的长度一般选择 2 的幂

        取模运算比较耗时,而位运算相对较高效,选择 2 的幂作为哈希表长度,可以将取模运算 转换成 二进制位与,令 m 等于 2 的 k 次,其二进制表示为:

        任何一个数模上 m,相当于取了 m 的二进制的低 k 位:

        m 的模运算 与 m - 1 的位于运算效果是一样的:x % S == x & (S - 1)

        除了直接定址法,其他方法都可能导致哈希冲突


6.哈希冲突的解决方案

        解决哈希冲突的主要两种方法:开放定址法链地址法,无论是开放地址法,还是链地址法,都可以实现哈希表,我们只需要选择其中一种即可。

Ⅰ、开放定址法

        开放定址法就是一旦发生冲突,就去寻找下一个空的地址,只要哈希表足够大,总能找到一空的位置,并且记录下来作为它的哈希值,公式:

d_i是一个数列,可以是常数列,也可以是等差数列

        哈希表的每个数据就是一个键,插入之前需要先进行查找,如果找到的位置未被插入则执行插入,否则找到下一个未被插入的位置进行插入。

        这种方法需要注意的是:当插入数据超过哈希表长度时,不能再执行插入,否则会造成死循环。

Ⅱ、链地址法

        当产生冲突后,我们也可以选择不换位置,还是在原来的位置,只是把 哈希值 相同的用链表串联起来,这种方法被称为链地址法。

        哈希表的每个数据,保留了链表头结点和尾结点,插入前需要先进行查找,如果找到的位置链表非空,则插入尾结点,并且更新尾结点。否则生成一个新的链表头结点和尾结点。


7.哈希表的初始化

        给定一个大小 n,申请一个 n 个元素的数组,元素类型是:哈希表键值对


8.哈希表的元素插入

     给定元素,利用哈希函数计算它的哈希值,对数组长度 n 取模以后,找到合适的位置,遍历这个位置上的链表,如果发现没有键值对相等的元素,则插入这个链表   


9.哈希表的元素删除

        给定元素,利用哈希函数计算它的哈希值,对数组长度 n 取模以后,找到合适的位置,遍历这个位置上的链表,如果发现有键值对相等的元素,则从链表上进行删除


10.哈希表的元素查找

        给定元素,利用哈希函数计算它的哈希值,对数组长度 n 取模以后,找到合适的位置,遍历这个位置上的链表,如果发现键值对相等的元素,返回 True;否则,返回 False。


二、Python中的哈希表

1.哈希表的创建(字典)

hash = {}
hash = {"e":3, "t":6, "a":1, "o":4, "i":5, "n":2}
print(hash)


2.哈希表的元素修改

Ⅰ、元素的索引

hash['u'] = 9
print(hash)hash['u'] = 4
print(hash)


Ⅱ、元素的添加

hash['z'] = 13
print(hash)


Ⅲ、元素的删除

hash.pop():用于移除字典中指定键的项,并返回该键对应的值。如果指定的键不存在,可提供一个默认值,否则会引发 KeyError 异常。

参数名类型是否必需描述
key任意可哈希类型需要从字典中移除的键
default任意类型如果指定的键不存在时返回的默认值,默认为 None
hash.pop('o')
print(hash)


Ⅳ、元素的修改

hash['z'] += 1print(hash['z'])


3.哈希表的查找与遍历

Ⅰ、通过键查找值

hash.get():用于返回指定键的值。如果键存在于字典中,则返回对应的值;如果键不存在,则返回默认值(默认为 None),不会引发 KeyError 异常。

hash.get(x, 0) + 1:通过遍历列表 nums,使用哈希表(字典)hash 可以统计每个元素的出现次数。

参数名类型是否必需描述
key任意可哈希类型需要查找值的键
default任意类型如果指定的键不存在时返回的默认值,默认为 None
print(hash.get('x', 9))

Ⅱ、遍历哈希表的键

hash.keys():返回一个视图对象,该对象包含了字典中所有的键。

for k in hash.keys():print(k, end = " ")


Ⅲ、遍历哈希表的值

hash.values(): 返回一个视图对象,该对象包含了字典中所有的值。

for v in hash.values():print(v, end = " ")


Ⅳ、遍历哈希表的键和值 

hash.items():返回一个视图对象,该对象包含了字典中所有的键值对,每个键值对以元组的形式表示。

for k,v in hash.items():print(k, v, end = " ")


三、代码实战

1512. 好数对的数目

给你一个整数数组 nums 。

如果一组数字 (i,j) 满足 nums[i] == nums[j] 且 i < j ,就可以认为这是一组 好数对 。

返回好数对的数目。

示例 1:

输入:nums = [1,2,3,1,1,3]
输出:4
解释:有 4 组好数对,分别是 (0,3), (0,4), (3,4), (2,5) ,下标从 0 开始

示例 2:

输入:nums = [1,1,1,1]
输出:6
解释:数组中的每组数字都是好数对

示例 3:

输入:nums = [1,2,3]
输出:0

提示:

  • 1 <= nums.length <= 100
  • 1 <= nums[i] <= 100

方法一、哈希表

思路与算法
  1. 哈希表记录频次:使用字典(哈希表)hash 记录每个元素已出现的次数。
  2. 累加配对数:遍历数组时,对于当前元素 x,检查它之前已出现的次数 hash.get(x, 0),将这些次数累加到 count 中(每次出现的新元素会与之前所有相同元素形成新对)。
  3. 动态更新频次:将当前元素 x 的出现次数加 1,更新到哈希表中。

关键点:每个元素 x 在遍历时,仅统计它之前出现的次数,从而避免重复计数。

class Solution:def numIdenticalPairs(self, nums: List[int]) -> int:hash = {}n = len(nums)count = 0for i in range(n):x = nums[i]count += hash.get(x, 0)hash[x] = hash.get(x, 0) + 1return count


方法二、二重循环

思路与算法

此方法为暴力解法,通过双重循环遍历数组中所有可能的索引对 (i, j)(其中 i < j),直接比较元素是否相等。若相等则计数器 count 加 1。

关键点

  • 时间复杂度高,但逻辑简单直观。
  • 适用于小规模数据,但对大规模数据效率极低。
class Solution:def numIdenticalPairs(self, nums: List[int]) -> int:n = len(nums)count = 0for i in range(n):for j in range(i + 1, n):if nums[i] == nums[j]:count += 1return count


961. 在长度 2N 的数组中找出重复 N 次的元素

给你一个整数数组 nums ,该数组具有以下属性:

  • nums.length == 2 * n.
  • nums 包含 n + 1 个 不同的 元素
  • nums 中恰有一个元素重复 n 次

找出并返回重复了 n 次的那个元素。

示例 1:

输入:nums = [1,2,3,3]
输出:3

示例 2:

输入:nums = [2,1,2,5,3,2]
输出:2

示例 3:

输入:nums = [5,1,5,2,5,3,5,4]
输出:5

提示:

  • 2 <= n <= 5000
  • nums.length == 2 * n
  • 0 <= nums[i] <= 104
  • nums 由 n + 1 个 不同的 元素组成,且其中一个元素恰好重复 n 次

方法一、哈希表

思路与算法

① 遍历列表统计列表中元素及其出现次数

② 遍历哈希表,找到频次等于 n // 2的元素

class Solution:def repeatedNTimes(self, nums: List[int]) -> int:hash = {}for x in nums:hash[x] = hash.get(x, 0) + 1for k, v in hash.items():if v == len(nums) // 2:return k


1207. 独一无二的出现次数

给你一个整数数组 arr,如果每个数的出现次数都是独一无二的,就返回 true;否则返回 false

示例 1:

输入:arr = [1,2,2,1,1,3]
输出:true
解释:在该数组中,1 出现了 3 次,2 出现了 2 次,3 只出现了 1 次。没有两个数的出现次数相同。

示例 2:

输入:arr = [1,2]
输出:false

示例 3:

输入:arr = [-3,0,1,-3,1,1,1,-3,10,0]
输出:true

提示:

  • 1 <= arr.length <= 1000
  • -1000 <= arr[i] <= 1000

方法一 哈希表

思路与算法

统计频次:使用字典 count 统计每个元素的出现次数。

检查重复:使用字典 hash 记录已出现的次数值。若某次数的值已存在,则说明有重复,直接返回 False;否则继续遍历。

最终判定:若所有次数均无重复,返回 True

将测试用例代入哈希表流程进行实验:

class Solution:def uniqueOccurrences(self, arr: List[int]) -> bool:count = {}# arr = [1,2,2,1,1,3]for i in arr:# count[1] = 1# count[2] = 1# count[2] = 2# count[1] = 2# count[1] = 3# count[3] = 1count[i] = count.get(i, 0) + 1hash = {}for i in count.values():# 1:3 2:2 3:1if hash.get(i):# hash = {}             hash = {3:1}            hash = {3:1, 2:1}# hash.get(3) = None    hash.get(2) = None      hash.get(1) = Nonereturn False# hash[3] = 1           hash[2] = 1             hash[1] = 1hash[i] = 1return True     # 遍历完成,返回True

 

class Solution:def uniqueOccurrences(self, arr: List[int]) -> bool:count = {}# arr = [1,2]for i in arr:# count[1] = 1# count[2] = 1count[i] = count.get(i, 0) + 1hash = {}for i in count.values():# 1:1 2:1# hash = {}         hash = {1:1}if hash.get(i):   # hash.get(1) = Truereturn False  # return False  # hash[1] = 1hash[i] = 1return True     # 遍历完成,返回True
解题代码
class Solution:def uniqueOccurrences(self, arr: List[int]) -> bool:count = {}for i in arr:   count[i] = count.get(i, 0) + 1        hash = {}for v in count.values():if hash.get(v):return Falsehash[v] = 1return True

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/73491.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

历年云南大学计算机复试上机真题

历年云南大学计算机复试机试真题 在线评测&#xff1a;传送门&#xff1a;pgcode.cn 喝饮料 题目描述 商店里有 n 中饮料&#xff0c;第 i 种饮料有 mi 毫升&#xff0c;价格为 wi。 小明现在手里有 x 元&#xff0c;他想吃尽量多的饮料&#xff0c;于是向你寻求帮助&#x…

[文献阅读] 可变形卷积DCN - Deformable Convolutional Networks

**文献信息&#xff1a;**Deformable Convolutional Networks arxiv.org/abs/1703.06211 发表于ICCV 2017&#xff0c;提出了可变形卷积DCN&#xff08;Deformable ConvNets&#xff09; 摘要 卷积神经网络&#xff08;CNN&#xff09;由于其构建模块固定的几何结构天然地局限…

德语A1学习

Hast du morgen Zeit? Wann spielen wir? Vocabulary etwas/jemanden brauchen braucht, brauchte, hat gebraucht to need something/somebody Das geht. That works./Thats OK. den ganzen Tag the entire day dieser, diese, dieses this erst just; only G…

路局的上道检修过程中,利用AI视觉技术对轨道两旁设备设施进行检修

在铁路局的上道检修过程中,利用AI视觉技术对轨道两旁设备设施(如信号设备、电缆、接触网、通信设备等)以及铁路上方的电线(如接触网、电力线)进行异常检测,可以显著提高检修效率、降低人工成本并增强安全性。以下是具体的应用方案和技术路径: 1. 应用场景 1.1 轨道两旁…

函数指针/逗号表达式/不用if语句完成的字母输出题

1.函数指针用的不是那么频繁的一个操作&#xff1a; 下面是代码演示&#xff1a; 在这个int (*jump)(int);中 jump是这个指针变量名称&#xff0c;第一个int是指针类型&#xff0c;第二个int是指的这个指针所指的函数参数是int类型的。 #include <stdio.h>// 定义一个…

uniapp报毒

uniapp打包的apk&#xff0c;装机量多了就开始报毒&#xff0c;尝试了多种解决办法都无解&#xff01;&#xff01; 去某宝&#xff0c;解决一次50-100不等&#xff0c;并且没有售后&#xff0c;掉了重新做包&#xff0c;很是无解&#xff0c;包月价格更是离谱。 为此自行测试…

IIS EXPRESS 虚拟目录经验谈!

最近在给客户开发一个事件提醒软件&#xff0c;用的是c# 版本是vs2022&#xff0c;在运行调试程序时&#xff0c;电脑会自动启动IIS Express,电脑右小角出现两个虚拟目录&#xff0c;对应两个端口&#xff0c;图示如下&#xff1a; 只能点击选择http://localhost:52726&#xf…

小程序配置

注册小程序账号和安装开发工具 参考文档&#xff1a;注册小程序账号和安装开发工具https://blog.csdn.net/aystl_gss/article/details/127878658 HBuilder新建项目 填写项目名称&#xff0c;选择UNI-APP&#xff0c;修改路径&#xff0c;点击创建 manifest.json 配置 需要分别…

左叶子之和 找左下角的值 路径总和

1.计算给定二叉树的所有左叶子之和。 #include <bits/stdc.h> using namespace std; struct TreeNode{ int val; TreeNode* left; TreeNode* right; TreeNode(int x) { valx; leftNULL; rightNULL; } }; int findsum(T…

Matlab实现RIME-CNN-LSTM-Multihead-Attention多变量多步时序预测

SCI一区级 | Matlab实现RIME-CNN-LSTM-Multihead-Attention多变量多步时序预测 目录 SCI一区级 | Matlab实现RIME-CNN-LSTM-Multihead-Attention多变量多步时序预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现RIME-CNN-LSTM-Multihead-Attention霜冰算法…

996引擎-自定义属性-方法2:setitemcustomabil

996引擎-自定义属性-方法2:setitemcustomabil 先看下效果测试NPC补全测试代码辅助表公式setitemcustomabil 总结参考资料先看下效果 测试NPC 为了方便测试,先准备个NPC require("Envir/QuestDiary/ex/init.lua"); require("Envir/QuestDiary/utils/init.lu…

苹果电脑杀毒软件CleanMyMac

杀毒软件在苹果家族中是一个小众软件&#xff0c;百度搜索苹果电脑杀毒软件&#xff0c;可能各种杀软良莠不齐&#xff0c;因为在这个市场非常小&#xff0c;绝大多数都是冲着“清理”去的&#xff0c;而不是杀毒。最近测试了一款Mac电脑杀毒软件&#xff0c;杀毒效果也是一般般…

pandas表格内容比较

前阵子来了一个211大学实习生&#xff08;小男生&#xff09;&#xff0c;要比较2个版本字段的变化&#xff0c;辅助完成系统升级字段替换&#xff0c;要求找出哪些字段是新增的&#xff0c;哪些字段是删除的&#xff0c;哪些字段是属性信息修改的&#xff0c;要求半天时间搞定…

【SpringBoot】最佳实践——JWT结合Redis实现双Token无感刷新

JWT概览 JWT概念 JWT是全称是JSON WEB TOKEN&#xff0c;是一个开放标准&#xff0c;用于将各方数据信息作为JSON格式进行对象传递&#xff0c;可以对数据进行可选的数字加密&#xff0c;可使用RSA或ECDSA进行公钥/私钥签名。JWT最常见的使用场景就是缓存当前用户登录信息&am…

面试系列|蚂蚁金服技术面【1】

哈喽&#xff0c;大家好&#xff01;今天分享一下蚂蚁金服的 Java 后端开发岗位真实社招面经&#xff0c;复盘面试过程中踩过的坑&#xff0c;整理面试过程中提到的知识点&#xff0c;希望能给正在准备面试的你一些参考和启发&#xff0c;希望对你有帮助&#xff0c;愿你能够获…

eBPF 实时捕获键盘输入

eBPF 实时捕获键盘输入 本文将带你一步步实现一个基于eBPF kprobe的键盘记录功能&#xff0c;通过Go语言配合libbpfgo&#xff0c;你将学会如何无损地监控系统键盘输入&#xff0c;并从中获取实时数据&#xff0c;进一步提高系统安全和监控能力。 1. 说明 本文属于专栏 Go语言…

APB-清华联合腾讯等机构推出的分布式长上下文推理框架

APB (Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks acrossGPUs)是清华大学等机构联合提出的分布式长上下文推理框架。通过稀疏注意力机制和序列并行推理方式&#xff0c;有效解决了大模型处理长文本时的效率瓶颈。APB采用更小的Anch…

数据库分库分表介绍

分库分表是解决数据库性能瓶颈的常用技术手段&#xff0c;主要用于应对数据量过大、读写压力过高的问题。通过将数据分散到多个数据库或表中&#xff0c;可以提高系统的扩展性和性能。 1. 分库分表的核心概念 &#xff08;1&#xff09;分库 定义&#xff1a;将数据分散到多个…

#mapreduce打包#maven:could not resolve dependencies for project

打包报错&#xff1a; #报错信息&#xff1a; [ERROR] Failed to execute goal on project mapreduce_teacher1: Could not resolve dependencies for project org.example:mapreduce_teacher1:jar:1.0-SNAPSHOT: Failed to collect dependencies at org.apache.hive:hive-exe…

Rabit

之前发过rabit了&#xff0c;所以这里不再赘述&#xff0c;讲讲原理 在线Rabbit加密 | Rabbit解密- 在线工具 (sojson.com) rabbit加密原理 Rabbit加密算法是一种流密码算法&#xff0c;由Daniel J. Bernstein设计&#xff0c;并被广泛用于多种加密和安全通信应用中。它的设…