Python学习基础笔记六十九——文本2

二进制(字节)模式:

文本文件,纯文本文件就是保存文本字符串的文件,跟word还不一样,word是富文本文件。

其实就文件存储的底层来说,不管什么类型的文件(文本、视频、图片、word、Excel等),存储的都是字节,不存在文本和二进制的区别,可以说是二进制。

二进制模式 这个名词容易引起误解,字节模式更好。

读写文件底层操作都是字节。纯文本底层就是一个个字节。图片底层也是一个个字节。

以文本模式打开文件后,后面的读写文件的方法(比如read、write等),底层实现都会自动的进行字符串对应的python的字符串和字节串(bytes对象)的转换。

我们可以指定open的mode参数,直接读取原始的二进制字符串到一个bytes字节串对象中。

# mode参数指定为rb 就是用二进制读的方式打开文件
f = open('tmp.txt', 'rb')
content = f.read()
f.close()  # 由于是 二进制方式打开,所以得到的content是 字节串对象 bytes
# 内容为 b'\xe7\x99\xbd\xe6\x9c\x88\xe9\xbb\x91\xe7\xbe\xbd'
print(content)# 该对象的长度是字节串里面的字节个数,就是12,每3个字节对应一个汉字的utf8编码
print(len(content))

代码说明:

f.read()读取文件的时候,由于是rb模式,读取的就是文件的原始的字节码,不再需要进行编解码操作了。

即使这个文件是一个文本文件,f.read()读取到的是字节码bytes文本。因为写进来的时候就是经过编码encode操作,保存到文件中的。 

# mode参数指定为rb 就是用二进制读的方式打开文件
f = open('tmp.txt', 'rb')
content = f.read()
f.close()# 由于是 二进制方式打开,所以得到的content是 字节串对象 bytes
# 内容为 b'\xe7\x99\xbd\xe6\x9c\x88\xe9\xbb\x91\xe7\xbe\xbd'
print(content.decode('utf8'))# 该对象的长度是字节串里面的字节个数,就是12,每3个字节对应一个汉字的utf8编码
print(len(content))

我们也可以使用decode函数对content的字节码进行解码操作。运行程序得到字符串文本内容。

另外,len函数,如果参数是字节串,就是字节串的长度,如果是字符串,就是字符的长度。每个字节对应一个汉字的utf8编码。

以二进制写数据到文件中,传给write方法的参数不能是字符串,只能是bytes对象。

# mode参数指定为 wb 就是用二进制写的方式打开文件
f = open('tmp.txt', 'wb')content = '上海市漕河泾'
# 二进制打开的文件, 写入的参数必须是bytes类型,
# 字符串对象需要调用encode进行相应的编码为bytes类型
f.write(content.encode('utf8'))f.close()

如果我们更改编码方式,例如改成gbk的编码格式。

文件默认的打开方式是UTF-8。所以IDE提示我们要Road in ‘GBK’解码方式。

那这样,就得到了正确的解码字符串。

用字节实现一个简单的文件拷贝功能。

def fileCopy(srcPath,destPath):srcF = open(srcPath,'rb')content = srcF.read()srcF.close()destF = open(destPath,'wb')destF.write(content)destF.close()fileCopy('1.png','1copy.png')

比如大文件、10个G的文件,直接来读的话,就容易出问题。所以有算法支持,每次10K。算法优化。

这个字节文件,可以对图片文件进行拷贝。

如果不用字节方式:使用文本方式来读取写入信息。

如果里面有一个字节会按默认方式gbk的方式进行解码,会碰到有些字节无法解码,显示乱码。所以必须用二进制方式进行读写。那这个时候就需要进行编解码。

跳过编解码直接通过字节进行拷贝。效率就提高了。

另外,gbk的效率比uncode的效率高一点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/105687.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

rsync 备份工具(附rsync+inotify 实时同步部署实例)

rsync 备份工具(附rsyncinotify 实时同步部署实例) 1、rsync概述1.1关于rsync1.2rsync 的特点1.3工作原理 2、rsync相关命令2.1基本格式和常用选项2.2启动和关闭rsync服务2.3下行同步基本格式2.4上行同步基本格式2.5免交互2.5.1指定密码文件2.5.2rsync-daemon方式2.…

博弈论:gym104065j

https://vjudge.net/contest/587311#problem/J 我也不知道我在此题中学到了什么套路 结论:你选的数必须尽量接近 s u m 3 \frac {sum} 3 3sum​,然后这个就是解 因为另外两人选的是和你的数相比不可能更接近,所以必然一个大一个小 唯一的…

2.9 深入GPU硬件架构及运行机制

五、GPU技术要点 1.SMID和SIMT SIMD(Single Instruction Multiple Data)是单指令多数据,在GPU的ALU(在Core内)单元内,一条指令可以处理多维向量(一般是4D)的数据。比如&#xff0c…

sklearn 机器学习基本用法

# # 科学计算模块 # import numpy as np # import pandas as pd # # 绘图模块 # import matplotlib as mpl # import matplotlib.pyplot as plt # from sklearn.linear_model import LinearRegression # from sklearn import datasets # from sklearn.model_selection import t…

宅在家里也能干的副业,每天挣60—300元,人人可做

想在家搞副业,每天挣60-300元,大家觉得难吗?我告诉你,一点也不难。找对路子,足不出户也能搞钱。今天我就给大家分享一下三个网上靠谱的副业,门槛低上手快,只需一部手机,每天利用碎片…

Hazelcast系列(三):hazelcast集成(服务器/客户端)

系列文章 Hazelcast系列(一):初识hazelcast Hazelcast系列(二):hazelcast集成(嵌入式) Hazelcast系列(三):hazelcast集成(服务器/客户端) Hazelcast系列(四):hazelcast管理中心 …

动态规划:918. 环形子数组的最大和

个人主页 : 个人主页 个人专栏 : 《数据结构》 《C语言》《C》《算法》 文章目录 前言一、题目解析二、解题思路解题思路状态表示状态转移方程初始化填表顺序返回值 三、代码实现总结 前言 本篇文章仅是作为小白的我的一些理解,,…

docker安装skyWalking笔记

确保安装了docker和docker-compose sudo docker -v Docker version 20.10.12, build 20.10.12-0ubuntu4 sudo docker-compose -v docker-compose version 1.29.2, build unknown 编写docker-compose.yml version: "3.1" services: skywalking-oap:image: apach…

ELF和静态链接:为什么程序无法同时在Linux和Windows下运行?

目录 疑问 编译、链接和装载:拆解程序执行 ELF 格式和链接:理解链接过程 小结 疑问 既然我们的程序最终都被变成了一条条机器码去执行,那为什么同一个程序,在同一台计算机上,在 Linux 下可以运行,而在…

《机器学习》第5章 神经网络

文章目录 5.1 神经元模型5.2 感知机与多层网络5.3 误差逆传播算法5.4 全局最小与局部最小5.5 其他常见神经网络RBF网络ART网络SOM网络级联相关网络Elman网络Boltzmann机 5.6 深度学习 5.1 神经元模型 神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它…

sql 注入(1), union 联合注入

sql 注入, union 联合注入 一, 参数分类 根据可控参数的类型不同, 对注入类型分类: 1. 数字型select * from table where id1 2. 字符型select * from table where usernameroot 3. 搜索型select * from table where id like %root% 4. 关于注释:注入时, 在查询参数中使用注…

如何做好数据分析中的数据可视化?

数据可视化在数据分析中扮演着重要的角色,它帮助我们更好地理解和传达数据的特征、趋势和规律。以下是关于如何做好数据分析中的数据可视化的详细介绍。 一、准备工作 1. 理解数据 在进行数据可视化之前,首先要对数据有一个清晰的理解。了解数据的来源…

Yakit工具篇:简介和安装使用

简介(来自官方文档) 基于安全融合的理念,Yaklang.io 团队研发出了安全领域垂直语言Yaklang,对于一些无法原生集成在Yak平台中的产品/工具,利用Yaklang可以重新编写 他们的“高质量替代”。对于一些生态完整且认可度较高的产品,Y…

JavaScript 通过数组对JSON key字段进行排序

这里我以vue为例 不过json排序用的js方式 任何前端项目都可以通过js完成 我们组件代码现在是这样的 <template><div><div v-for "item in navCateList" :key "item.id">{{ item.name }}</div></div> </template>&…

使用.NET实现WOL唤醒远程开机

文章目录 1. 背景2. 关于 WOL2.1 WOL 工作原理2.2 开启网卡唤醒功能 3. 快速验证3.1 局域网 Wake on Lan 应用3.2 Ubuntu 的 etherwake 命令4. 代码实现4.1 创建.NET控制台应用程序4.2 编写代码4.3 运行应用程序 5. 最后 1. 背景 家居自动化是现代智能家居的重要组成部分&…

[ROS2系列] ubuntu 20.04测试rtabmap

目录 背景&#xff1a; 一、配置 turtlebot3 二、安装RTAB-Map ROS2包&#xff1a; 三、启动 Turtlebot3 模拟器&#xff1a; 四、启动 RTAB 地图&#xff1a; 五、启动导航&#xff08;nav2_bringup应安装软件包&#xff09;&#xff1a; 背景&#xff1a; 1、设备&…

矩阵键盘行列扫描

/*----------------------------------------------- 内容&#xff1a;如计算器输入数据形式相同 从右至左 使用行列扫描方法 ------------------------------------------------*/ #include<reg52.h> //包含头文件&#xff0c;一般情况不需要改动&#xff0c;头文件包含…

杀死僵尸进程ZooKeeperMain

关闭Hadoop后jps发现还有个进程ZooKeeperMain没有关闭&#xff0c;使用kill -9 <>也没有用&#xff0c;这种就是僵尸进程&#xff0c;需要用父进程ID来杀死 解决方法 话不多说&#xff0c;直接上解决方案&#xff0c; 1. 第一步 清楚需要关闭的进程ID&#xff0c;我…

项目配置vue.config jsconfig babel.config .prettierc .env .eslintrc

.env 在一个产品的前端开发过程中&#xff0c;一般来说会经历本地开发、测试脚本、开发自测、测试环境、预上线环境&#xff0c;然后才能正式的发布。对应每一个环境可能都会有所差异&#xff0c;比如说服务器地址、接口地址、websorket地址…… 等等。在各个环境切换的时候&am…

小程序 | 小程序后端用什么语言开发比较好

目录 ♣️ 引言 选择合适的后端语言 推荐使用Node.js Node.js 的优点 其他备选语言 ♣️ 小结 ♣️ 引言 小程序的兴起已经成为了当今移动互联网时代的热点之一&#xff0c;而小程序后端的好坏直接影响着小程序的使用体验&#xff0c;因此&#xff0c;选择一种好的语言来…