Python学习之路20-数据模型

《流畅的Python》笔记。
本篇是Python进阶篇的开始。本篇主要是对Python特殊方法的概述。

1. 前言

数据模型其实是对Python框架的描述,它规范了这门语言自身构件模块的接口,这些模块包括但不限于序列、迭代器、函数、类和上下文管理器。不管在哪种框架下写程序,都会花费大量时间去实现那些会被框架本身调用的方法,Python也不例外。Python解释器碰到特殊句法时,会使用特殊方法去激活一些基本的对象操作,这些特殊方法的名字以两个下划线开头,以两个下划线结尾(所以特殊方法也叫双下方法 dunder method),这些特殊方法名能让自己编写的对象实现和支持以下的语言构架,并与之交互:

迭代、集合类、属性访问、运算符重载、函数和方法的调用、对象的创建和销毁、字符串表示形式和格式化、管理上下文(即with块)。

下面通过一些例子来介绍常用的特殊方法。

2. Python风格纸牌

首先介绍两个特殊方法__getitem____len__这两个特殊方法。以下代码创建了一个纸牌类:

import collectionsCard = collections.namedtuple("Card", ["rank", "suit"])class FrenchDeck:ranks = [str(n) for n in range(2, 11)] + list("JQKA")# 黑桃,红桃,方块,梅花suits = "spades diamonds clubs hearts".split()def __init__(self):# 嵌套循环self._cards = [Card(rank, suit) for suit in self.suits for rank in self.ranks]def __len__(self):return len(self._cards)def __getitem__(self, position):return self._cards[position]

namedtuple,即命名元组,类似于C/C++中的struct,定义如下:

collections.namedtuple(typename, field_names, verbose=False, rename=False)

第一个参数是元组名;第二个是该元组中含的属性名;第三个参数表示在构建该命名元组之前先打印出该命名元组的结构,如果在控制台输入第3行代码,并置verboseTrue的话,会输出该命名元组的内部结构,实际上它是一个继承自tuple的类,由于输出过长,请大家自行实验;如果该命名元组的元素名中有Python关键字,则需要置第四个参数为True,这些与关键字重名的元素名会被特殊处理。

用命名元组创建一个不带方法的对象十分简单:

>>> from chapter20 import Card, FrenchDeck
>>> beer_card = Card("7", "diamonds")
>>> beer_card
Card(rank='7', suit='diamonds')

由于FrenchDeck实现了__getitem__方法,所以可以像操作ListTuple一样操作FrenchDeck,比如随机访问,切片:

>>> deck = FrenchDeck()
>>> len(deck)
52
>>> deck[0]
Card(rank='2', suit='spades')
>>> deck[-1]
Card(rank='A', suit='hearts')
>>> from random import choice
>>> choice(deck)
Card(rank='4', suit='clubs')
>>> choice(deck)
Card(rank='J', suit='clubs')
>>> deck[:3]
[Card(rank='2', suit='spades'), Card(rank='3', suit='spades'), Card(rank='4', suit='spades')]
>>> deck[12::13]
[Card(rank='A', suit='spades'), Card(rank='A', suit='diamonds'), 
Card(rank='A', suit='clubs'), Card(rank='A', suit='hearts')]

由于实现了该方法,FrenchDeck还是个可迭代对象,即可以用for循环对其访问(也可以反向访问reversed):

>>> for card in deck:
>>> ... print(card)Card(rank='2', suit='spades')
Card(rank='3', suit='spades')
Card(rank='4', suit='spades')
-- snip --
Card(rank='Q', suit='hearts')
Card(rank='K', suit='hearts')
Card(rank='A', suit='hearts')

迭代通常是隐式的,譬如说一个集合类型没有实现__contains__方法,那么in运算符就会按顺序做一次迭代搜索(调用__getitem__),于是in运算符可以用在FrenchDeck上:

>>> Card('2', 'spades') in deck
True

如果对上述deck变量调用sorted函数,Python将按ASCII码进行排序,但这并不是扑克牌的正确排序,所以下面我们自定义排序方法:

suit_values = dict(spades=3, hearts=2, diamonds=1, clubs=0)def spades_high(card):rank_value = FrenchDeck.ranks.index(card.rank)return rank_value * len(suit_values) + suit_values[card.suit]for card in sorted(deck, key=spades_high):print(card)

此时输出的结果就是先按点数排序,再按花色排序。

3. 如何使用特殊方法

需要明确一点,特殊方法的存在是为了给Python解释器调用到,作为程序员并不需要调用他们,也即是说,没有my_object.__len__()这种写法,而应该是len(my_object)。说到__len__方法,如果是Python内置类型,CPython会抄个近路,该方法实际上会直接返回PyVarObject里的ob_size属性,而PyVarObject是表示内存中长度可变的内痔对象的C语言结构体。

很多时候特殊方法的调用是隐式的,比如for i in x:这个语句,背后其实用的是iter(x),而这个函数的背后则是x.__iter__()方法,当然前提是这个方法在x中被实现(如果没被实现则会调用__getitem__方法)。

直接调用这个值比调用一个方法快很多。直接调用特殊方法的频率应该远远低于你去实现它们的次数。

通过内置的函数(例如leniterstr等)来使用特殊方法是最好的选择。这些内置函数不仅会调用特殊方法,通常还提供额外的好处,而且对于内置的类来说,它们的速度更快。

还有一点值得注意:不要想当然地随意添加特殊方法,比如__foo__之类的,因为虽然现在这个名字没有被Python内部使用,以后就不一定了。

3.1 自定义向量Vector

使用5个特殊方法实现Vector的字符串输出,取绝对值(如果是复数则是取模),返回布尔值,加法和数乘等运算:

from math import hypotclass Vector:def __init__(self, x=0, y=0):self.x = xself.y = ydef __repr__(self):return "Vector(%r, %r)" % (self.x, self.y)def __abs__(self):return hypot(self.x, self.y)# 在Python中,只有0,NULL才是False,其余均为Truedef __bool__(self):# 更简单的写法是:# return bool(self.x or self.y)return bool(abs(self))# 实现加法运算符重载def __add__(self, other):return Vector(self.x + other.x, self.y + other.y)# 实现乘法运算符重载,这里是数乘,且还没有实现交换律(需要实现__rmul__方法)def __mul__(self, scalar):return Vector(self.x * scalar, self.y * scalar)

Python有一个内置函数叫做repr。该函数通过特殊方法__repr__来得到一个对象的字符串表示形式,如果没有该特殊方法,当我们在控制台打印一个向量对象时,得到的字符串可能是<Vector object at 0x10e00070>

# 代码:
v1 = Vector(2, 4)
v2 = Vector(2, 1)
print(v1 + v2)
print(abs(v1))
print(v1 * 3)# 结果:
Vector(4, 5)
4.47213595499958
Vector(6, 12)

__repr____str__的区别与联系:前者方便我们调试和记录日志,后者则是给终端用户看的。后者是在str()函数被使用,或者是在print函数打印一个对象的时候才被调用,它返回的字符串对终端用户友好。如果只想实现这两个特殊方法中的一个,__repr__是更好的选择,因为如果一个对象没有__str__函数,Python又需要调用它时,解释器会用__repr__代替。

上述Vector类实现了__bool__方法,它可用于需要布尔值的上下文中(if, while, and, or, not等)。默认情况下,我们自己定义的类的实例总被认为是True,除非重写了这个类的__bool____len__方法。bool(x)的背后是调用x.__bool__();如果不存在__bool__方法,那么bool(x)会尝试调用x.__len__(),如果该方法返回0,则bool返回False,否则返回True

3.2 为什么len不是普通方法

“实用胜于纯粹”(Python之禅里的一句话)。len之所以不是一个普通方法,是为了让Python自带的数据结构可以走后门,abs也是同理。但多亏了它是特殊方法,我们也可以把len用于自定义数据类型。这种处理方式在保持内置类型的效率和保证语言的一致性之间找到了一个平衡点,也印证了“Python之禅”中的另一句话:“不能让特例特殊到考试破坏既定规则”。

4. 总结

通过实现特殊方法,自定义数据类型可以表现得跟内置类型一样,从而让我们写出更具Python风格(Pythonic)的代码。后面的内容将围绕更多的特殊方法展开。


迎大家关注我的微信公众号"代码港" & 个人网站 www.vpointer.net ~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/451643.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《netty实战》阅读笔记(2)——Netty 的数据容器ByteBuf

ByteBuffer 当我们进行数据传输的时候&#xff0c;往往需要使用到缓冲区&#xff0c;常用的缓冲区就是JDK NIO类库提供的java.nio.Buffer。 实际上&#xff0c;7种基础类型&#xff08;Boolean除外&#xff09;都有自己的缓冲区实现&#xff0c;对于NIO编程而言&#xff0c;我们…

32位Windows7上8G内存使用感受+xp 32位下使用8G内存

我推荐做开发的朋友:赶快加入8G的行列吧....呵呵..超爽...速度超快...基本没有等待的概念...深有体会... 为什么要使用8G内存&#xff1f;在国内外各大论坛上&#xff0c;这都是一个有争议的问题。问题的反方论据非常充分&#xff1a; 除了少数专业领域&#xff0c;大多数应用程…

面试常考的数据结构Java实现

1、线性表 2、线性链表 3、栈 4、队列 5、串 6、数组 7、广义表 8、树和二叉树 二叉树&#xff1a;每个结点至多只有两棵子树&#xff08;即二叉树中不存在度大于2的结点&#xff09;&#xff0c;并且&#xff0c;二叉树的子树有左右之分&#xff0c;其次序不能任意颠倒。 二叉…

Java5线程并发库之LOCK(锁)CONDITION(条件)实现线程同步通信

为什么80%的码农都做不了架构师&#xff1f;>>> Lock&#xff08;锁&#xff09;&Condition&#xff08;条件&#xff09;实现线程同步通信 接下来介绍&#xff0c;java5线程并发库里面的锁。跟锁有关的类和接口主要是位于java.util.concurrent.locks包。 Lock…

逻辑运算符与逻辑表达式

1 #include <stdio.h>2 3 int main()4 {5 int a0;int b0;6 if(a&&b)//a&&ba的逻辑值为0&#xff0c;则执行else7 {8 printf("a&&b is true\n");9 } 10 else 11 { 12 printf("a&&…

网站性能优化的三重境界

这篇文章是关于网站性能优化体验的&#xff0c;性能优化是一个复杂的话题&#xff0c;牵涉的东西非常多&#xff0c;我只是按照我的理解列出了性能优化整个过程中需要考虑的种种因素。点到为止&#xff0c;包含的内容以浅显的介绍为主&#xff0c;如果你有见解能告知我那再好不…

PYTHON 爬虫笔记十一:Scrapy框架的基本使用

Scrapy框架详解及其基本使用 scrapy框架原理 Scrapy是一个为了爬取网站数据&#xff0c;提取结构性数据而编写的应用框架。 其可以应用在数据挖掘&#xff0c;信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的&#xff0c; 也可…

服务器返回值 解释 ajax提交方式 后台数据刷进前端

转载于:https://www.cnblogs.com/liuliang389897172/p/9120715.html

no typehandler found for property XXXX 解决

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 1. ssm框架下 启动服务报错如题。 2. 原因&#xff1a; 我的情况是&#xff0c;代码中实体属性映射书写和数据库字段名字不一致。 数据…

shell中sed -i特殊字符

可参考文献&#xff1a; Linux生产环境上&#xff0c;最常用的一套“sed“技巧 看懂shell中的各种语句

Nginx 启动报错 “/var/run/nginx/nginx.pid failed”

问题&#xff1a; 重启虚拟机后&#xff0c;再次重启nginx会报错&#xff1a; open() "/var/run/nginx/nginx.pid" failed (2: No such file or directory) 解决方法&#xff1a; &#xff08;1&#xff09;进入 cd /usr/local/nginx/conf/ 目录&#xff0c;编辑配置…

eclipse关闭讨厌的菜单

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 1. 不知道动哪了&#xff0c;开启了这个菜单&#xff1a; 2. 很感谢群友帮我找到关闭方法&#xff0c;点击 如下 按钮&#xff1a; 然后就…

SSL加密工作原理RSA免密登录原理

SSL 是一个安全协议&#xff0c;它提供使用 TCP/IP 的通信应用程序间的隐私与完整性。因特网的 超文本传输协议&#xff08;HTTP&#xff09;使用 SSL 来实现安全的通信。 在客户端与服务器间传输的数据是通过使用对称算法&#xff08;如 DES 或 RC4&#xff09;进行加密的。…

我不知道的事——深克隆和浅克隆

推荐一部好电影《致命魔术》。&#xff08;此处为植入广告&#xff09; 推荐理由&#xff1a;涉及人性。画面不错&#xff0c;剧情跌宕&#xff0c;亦魔亦幻&#xff08;此处的”魔“为魔术的”魔“&#xff09;。虽然女猪脚不尽如人意&#xff0c;但是男猪脚比较帅。而…

服务器搭建

2019独角兽企业重金招聘Python工程师标准>>> 最近弄了个阿里云的服务器&#xff0c;想在上面搞点东西&#xff0c;故要搭建一套环境。登录linux&#xff0c;在终端输入 uname -a 即列出linux的内核版本号。&#xff08;服务器网址&#xff1a;http://101.132.235.56…

mybatis内部类映射写法

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 1. B类是A类中的内部类。 2.  映射写法&#xff1a; com.XXX.A$B , 注意A类和B类之间用 $ 表示内外关系&#xff0c;而不是常用的 …

Linux bash总结(一) 基础部分(适合初学者学习和非初学者参考)

第一部分 bash简介 —— 对bash进行简要介绍 第二部分 bash示例和书写流程 —— 以一个简单的bash为例&#xff0c;说明书写、执行bash的流程 第三部分 bash基础语法 —— 本章内容比较多&#xff0c;主要介绍if...else...条件判断&#xff0c;for循环等等。对于有编…

解决报错:java.util.UnknownFormatConversionException: Conversion = ‘p‘

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 1. ssm框架下 报错如题 2. 错误原因&#xff1a;我的情况是&#xff0c;代码中实体属性映射书写和数据库字段名字不一致。 选中位置数据…

TOAD连接Oracle数据库失败:OCI_INVALID_HANDLE解决

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 1. toad 连接Oracle数据库连接失败如图&#xff1a; 2. 导致这个情况的前因&#xff1a;toad运行情况下&#xff0c;突然断电。 3. 解决…

python-访问者模式

源码地址:https://github.com/weilanhanf/PythonDesignPatterns 说明&#xff1a; 访问者模式的基本想法是&#xff0c;软件系统中拥有一个由许多对象构成的、比较稳定的对象结构&#xff0c;这些对象的类都拥有一个 accept 方法用来接受访问者对象的访问。访问者是一个接口&am…