Python 字典键 “三变一” 之谜

开头:读者的“玄学”字典谜题

上周,朋友发来了一段让他抓耳挠腮的代码:

>>> {True: 'foo', 1: 'bar', 1.0: 'baz'}  
{True: 'baz'}  

“我明明定义了布尔True、整数1、浮点数1.0三个键,结果字典里只剩True一个键,值还变成了最后一个'baz'!这是啥情况?”

这条消息让我想起了当年自己初学 Python 时踩过的类似坑 —— 看似 “不同” 的键,在字典里却被 “合并” 了。今天,咱们就用这个新例子当 “线索”,一起拆解 Python 字典的底层逻辑。

第一步:字典的“盖楼”规则

要搞懂三个键为何只剩一个,得先明白字典是怎么“盖楼”的。

简单来说,字典的构建像搭乐高:先拼一个空架子(空字典),再按顺序往架子上装“键值对模块”。上面的代码等价于:

# 1. 拼空架子  
my_dict = {}  
# 2. 装第一个模块:键是True,值是'foo'  
my_dict[True] = 'foo'  
# 3. 装第二个模块:键是1,值是'bar'  
my_dict[1] = 'bar'  
# 4. 装第三个模块:键是1.0,值是'baz'  
my_dict[1.0] = 'baz'  

重点来了:字典的键是“喜新厌旧”的——如果后装的键和已存在的键“本质相同”,就会覆盖旧值。但问题是:True(布尔)、1(整数)、1.0(浮点数)明明是三种不同的类型,怎么就“本质相同”了?

第二步:True是“伪装的1”

要破解“键相同”的谜题,得从Python的类型关系说起。

在Python的世界里,布尔(bool)是整数(int)的“亲儿子”——官方文档明确写着:

“布尔类型是整数类型的子类型,True等价于整数1False等价于整数0。在大多数上下文中,布尔值的行为与对应的整数值一致。”

这意味着:

  • True == 1 → 是真的(True
  • 1 == 1.0 → 也是真的(浮点数1.0的数值等于整数1
  • 所以True == 1 == 1.0 → 全等于!

用代码验证:

>>> True == 1  
True  
>>> 1 == 1.0  
True  
>>> True == 1 == 1.0  
True  

原来,在字典的“视角”里,这三个键根本就是“同一个人”!所以当依次插入True: 'foo'1: 'bar'1.0: 'baz'时,后两次插入都是在“修改同一个键的值”,最终只保留最后一次的'baz'

第三步:哈希值——字典的“身份证号”

但这里还有个疑问:就算三个键“数值相等”,字典怎么确定它们是“同一个键”?难道只看==吗?

这就要说到字典的底层“黑科技”——哈希表(Hash Table)。字典能快速查找键值对,全靠哈希值:每个键会先通过__hash__方法生成一个哈希值(类似“身份证号”),字典根据这个号码把键“扔”到对应的“抽屉”里;查找时,也先算哈希值,再去对应的抽屉里找。

关键规则是:只有当两个键的哈希值相同,且==返回True时,字典才会认为它们是同一个键

验证这三个键的哈希值:

>>> hash(True)  
1  
>>> hash(1)  
1  
>>> hash(1.0)  
1  

三个键的哈希值都是1==又全返回True,字典自然把它们当同一个键。所以后插入的1: 'bar'1.0: 'baz',本质上都是在修改True对应的值。

第四步:为什么键是True而不是11.0

最后一个疑问:三个键数值相等、哈希相同,为什么最终字典的键是True,而不是后插入的11.0

这涉及字典的“键保留规则”:当多个键被视为相同时,字典会保留第一个插入的键对象。比如:

>>> temp = {1.0: 'test'}  
>>> temp[True] = 'update'  
>>> temp  
{1.0: 'update'}  

这里先插入1.0,后插入True(与1.0相等),字典会保留第一个键1.0,并更新它的值。回到原问题,原字典第一个插入的键是True,所以最终键是True,值被后续插入的'bar''baz'覆盖。

结论:三个“不同”键的终极真相

现在,我们可以彻底解开这个“变脸字典”的谜题了:

  1. 类型关系是根源:Python中boolint的子类,True等价于11又等价于1.0(数值相等)。
  2. 哈希值是身份证:三个键的哈希值都是1,字典通过“哈希值相同+==为True”判定它们是同一个键。
  3. 先到先得保键形:字典保留第一个插入的键对象(True),后续插入只更新值,不修改键。

所以,最终结果{True: 'baz'}的本质是:三个键被字典视为同一对象,后插入的值覆盖了前值,而键保留了第一个插入的True

写在最后:这行代码教会我的事

这个看似“玄学”的字典表达式,其实藏着Python最核心的设计逻辑:

  • 布尔类型的“隐藏身份”(int子类)
  • 字典的哈希表底层逻辑(哈希值+相等性双重校验)
  • 键值对的插入顺序对结果的影响

下次遇到类似“反直觉”的代码时,别急着怀疑语言bug——打开Python解释器,用==hash()验证一下,你会发现Python的底层逻辑远比想象中严谨。

毕竟,Python的“奇怪”,往往藏着最精妙的设计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/82923.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何选择 RabbitMQ、Redis 队列等消息中间件?—— 深度解析与实战评估

如何选择 RabbitMQ、Redis 队列等消息中间件?—— 深度解析与实战评估 1. 引言 在现代分布式系统架构中,消息队列(Message Queue,MQ) 作为解耦服务、异步处理和高效通信的关键组件,被广泛应用于高并发、微服务和数据流处理场景。选择合适的消息中间件不仅能提高系统的稳…

特征工程四:数据特征提取TfidfVectorizer的使用

TfidfVectorizer 深度解析 TfidfVectorizer 是 scikit-learn 中用于文本特征提取的核心工具,它将原始文本转换为 TF-IDF 特征矩阵,是自然语言处理(NLP)和文本挖掘的基础组件。 一、核心原理 1. TF-IDF 计算 TF (Term Frequency):词频&…

c/c++爬虫总结

GitHub 开源 C/C 网页爬虫探究:协议、实现与测试 网页爬虫,作为一种自动化获取网络信息的强大工具,在搜索引擎、数据挖掘、市场分析等领域扮演着至关重要的角色。对于希望深入理解网络工作原理和数据提取技术的 C/C 开发者,尤其是…

PostgreSQL 的表连接方法

PostgreSQL 的表连接方法 PostgreSQL 提供了多种高效的连接算法,每种方法适用于不同的查询场景。以下是 PostgreSQL 支持的四种主要表连接方法及其特点: 1 Nested Loop Join(嵌套循环连接) 工作原理 对外表的每一行&#xff0…

【Qt】qss语法详解

QSS (Qt Style Sheets) 语法格式详解 QSS 是 Qt 的样式表语言,类似于 CSS,用于自定义 Qt 应用程序的外观。以下是 QSS 的完整语法格式说明: 基本语法结构 selector {property: value;property: value;... }1. 选择器 (Selectors) 基本选择…

Azure资源创建与部署指南

本文将指导您如何在Azure平台上创建和配置必要的资源,以部署基于OpenAI的应用程序。 资源组创建 资源组是管理和组织Azure资源的逻辑容器。 在Azure门户顶端的查询框中输入"Resource groups"(英文环境)或"资源组"(中文环境)在搜索结果中点击"资…

Java后端快速生成验证码

Hutool是一个小而全的Java工具类库,它提供了很多实用的工具类,包括但不限于日期处理、加密解密、文件操作、反射操作、HTTP客户端等。 核心工具类:CaptchaUtil,CaptchaUtil 是 Hutool 提供的一个工具类,用于创建各种类…

sql 备份表a数据到表b

备份表a数据到表b mysql CREATE TABLE sys_dict_240702 LIKE sys_dict;INSERT INTO sys_dict_240702 SELECT * FROM sys_dict;mssql select * into t_Dict_240702 from t_Dict

2.4GHz无线通信芯片选型指南:集成SOC与低功耗方案解析

今天给大家分享几款2.4GHz无线通信芯片方案: 一、集成SOC芯片方案 XL2407P(芯岭技术) 集成射频收发机和微控制器(如九齐NY8A054E) 支持一对多组网和自动重传 发射功率8dBm,接收灵敏度-96.5dBm&#xff08…

Tomcat与纯 Java Socket 实现远程通信的区别

Servlet 容器​​(如 Tomcat) 是一个管理 Servlet 生命周期的运行环境,主要功能包括: ​​协议解析​​:自动处理 HTTP 请求/响应的底层协议(如报文头解析、状态码生成); ​​线程…

[超级简单]讲解如何用PHP实现LINE Pay API!

在 PHP 中实现 LINE Pay API 之前我应该​​做哪些准备?如何在 PHP 中实现 LINE Pay API? 目录 [前提] 环境使用 PHP 实现 LINE Pay API 的准备工作使用 PHP 实现 LINE Pay API概括 [前提] 环境 这次我们将使用SandBox环境(测试环境&a…

centos7.x下,使用宝塔进行主从复制的原理和实践

操作原理: 一、主库配置 1.修改 MySQL 配置文件 # 编辑主库配置文件(路径根据实际系统可能不同) vim /etc/my.cnf # 添加以下配置 [mysqld] server-id 1 # 唯一 ID,主库设置为 1 log-bin mysql-bin …

从零实现基于Transformer的英译汉任务

1. model.py(用的是上一篇文章的代码:从0搭建Transformer-CSDN博客) import torch import torch.nn as nn import mathclass PositionalEncoding(nn.Module):def __init__ (self, d_model, dropout, max_len5000):super(PositionalEncoding,…

c#建筑行业财务流水账系统软件可上传记账凭证财务管理系统签核功能

# financial_建筑行业 建筑行业财务流水账系统软件可上传记账凭证财务管理系统签核功能 # 开发背景 软件是给岳阳客户定制开发一款建筑行业流水账财务软件。提供工程签证单、施工日志、人员出勤表等信息记录。 # 财务管理系统功能描述 1.可以自行设置记账科目,做凭…

MySQL 8.0 OCP 1Z0-908 题目解析(2)

题目005 Choose two. Which two actions can obtain information about deadlocks? □ A) Run the SHOW ENGINE INNODB MUTEX command from the mysql client. □ B) Enable the innodb_status_output_locks global parameter. □ C) Enable the innodb_print_all_deadlock…

XA协议和Tcc

基于 XA 协议的两阶段提交 (2PC)。这是一种分布式事务协议,旨在保证在多个参与者(通常是不同的数据库或资源管理器)共同参与的事务中,所有参与者要么都提交事务,要么都回滚事务,从而维护数据的一致性。 你…

数据分析-图2-图像对象设置参数与子图

from matplotlib import pyplot as mp mp.figure(A figure,facecolorgray) mp.plot([0,1],[1,2]) mp.figure(B figure,facecolorlightgray) mp.plot([1,2],[2,1]) #如果figure中标题已创建,则不会新建窗口, #而是将旧窗口设置为当前窗口 mp.figure(A fig…

跳转语句:break、continue、goto -《Go语言实战指南》

在控制流程中,我们有时需要跳出当前循环或跳过当前步骤,甚至直接跳转到指定位置。Go 提供了三种基本跳转语句: • break:跳出当前 for、switch 或 select。• continue:跳过本轮循环,进入下一轮。• goto&a…

Linux中find命令用法核心要点提炼

大家好,欢迎来到程序视点!我是你们的老朋友.小二! 以下是针对Linux中find命令用法的核心要点提炼: 基础语法结构 find [路径] [选项] [操作]路径:查找目录(.表当前目录,/表根目录)…

MQTT协议详解:物联网通信的轻量级解决方案

MQTT协议详解:物联网通信的轻量级解决方案 引言 在物联网(IoT)快速发展的今天,设备间高效可靠的通信变得至关重要。MQTT(Message Queuing Telemetry Transport)作为一种轻量级的发布/订阅协议,已成为物联网通信的首选解决方案。本文将深入探…