Python从0到100(三十六):字符和字符集基础知识及其在Python中的应用

在这里插入图片描述

1. 字符和字符集概述

字符(Character)是构成书面语言的基本元素,它包括但不限于各国家的文字、标点符号、图形符号和数字。字符集(Character set)则是一个包含多个字符的系统,用于统一管理和编码不同的字符。

常见字符集

  • ASCII:最早的字符集之一,包含128个字符,主要覆盖了英语字母、数字和一些特殊符号。
  • GB2312:中国的字符集标准,主要用于简体中文字符的编码。
  • GB18030:GB2312的扩展,支持更多的汉字和符号。
  • Unicode:一个旨在包含世界上所有书写系统字符的字符集,它通过统一的编码方案解决了多种字符集并存的问题。

编码方式

  • ASCII编码:每个字符使用1个字节表示。
  • Unicode编码:通常使用2个字节或更多,具体取决于所使用的Unicode转换格式(UTF)。

UTF-8

UTF-8是Unicode的一种实现方式,它是一种变长编码方式,可以根据需要使用1到4个字节来表示一个字符。这种编码方式的优势在于它对ASCII的兼容性,以及对不同语言字符的有效编码。

2. Python 3中的字符串类型

Python 3提供了两种基本的字符串类型,以适应不同的使用场景:

  • str:表示Unicode文本,是Python中处理文本的标准方式。
  • bytes:表示原始的二进制数据,常用于网络传输和文件操作。

3. str和bytes类型之间的转换

在Python中,字符串和字节类型可以通过编码和解码操作互相转换:

从str到bytes

  • 使用encode()方法将字符串转换为字节类型:
    s = 'abc'
    print(type(s))  # 输出:<class 'str'>
    b = s.encode()  # 编码为字节类型
    print(type(b))  # 输出:<class 'bytes'>
    

从bytes到str

  • 使用decode()方法将字节类型转换回字符串:
    b = b'abc'
    print(type(b))  # 输出:<class 'bytes'>
    s = b.decode()  # 解码为字符串
    print(type(s))  # 输出:<class 'str'>
    

注意事项

编码和解码过程中,必须使用相同的字符集,否则可能会导致乱码或数据损坏。

4. 实际应用示例

ASCII字符的转换

当处理ASCII字符时,可以直接将字符串转换为字节类型,因为ASCII字符在UTF-8编码中占用1个字节:

s = 'abcdefg'
b1 = bytes(s, 'ascii')  # 显式指定ASCII编码
print(b1)  # 输出:b'abcdefg'
print(b1[0])  # 输出字符'a'的ASCII值:97
print(b1[:3])  # 输出:b'abc'

非ASCII字符的转换

对于包含非ASCII字符的字符串,需要指定正确的编码方式,如UTF-8:

s = "我喜欢python,今年25岁"
b2 = bytes(s, encoding="utf-8")
print(b2)  # 输出:b'\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2python\xef\xbc\x8c\xe4\xbb\x8a\xe5\xb9\xb425\xe5\xb2\x81'

编码和解码的完整示例

以下是从字符串到字节再到字符串的完整转换过程:

# 将字符串编码为字节
s = "我喜欢python,今年25岁"
b3 = s.encode("utf-8")
print(b3)  # 输出同上# 将字节解码回字符串
b4 = b'\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2python\xef\xbc\x8c\xe4\xbb\x8a\xe5\xb9\xb425\xe5\xb2\x81'
s_decoded = b4.decode("utf-8")
print(s_decoded)  # 输出:我喜欢python,今年25岁

通过这些示例,我们可以看到Python中字符串和字节类型转换的灵活性和重要性。正确地处理这些转换对于数据的存储、传输和处理至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/866230.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt windeployqt 打包的Qt动态库介绍

前言 在 Windows 平台&#xff0c;通常使用 Qt 的工具 windeployqt 将可执行文件的相关 Qt 依赖项部署到当前路径下。 Windows windeployqt 部署工具 Windows 部署工具 windeployqt 旨在自动化创建一个可部署文件夹的过程&#xff0c;该文件夹包含运行应用程序所需的 Qt 相关…

SpringBoot 启动流程一

SpringBoot启动流程一 我们首先创建一个新的springboot工程 我们不添加任何依赖 查看一下pom文件 我们创建一个文本文档 记录我们的工作流程 我们需要的是通过打断点实现 我们首先看一下启动响应类 package com.bigdata1421.start_up;import org.springframework.boot.Spr…

音视频流媒体视频平台LntonAIServer视频监控平台工业排污检测算法

在当今社会&#xff0c;环境保护和可持续发展已成为全球关注的焦点。工业生产作为经济发展的重要支柱&#xff0c;其对环境的影响不容忽视。因此&#xff0c;如何有效地监控和管理工业排污&#xff0c;成为了一个亟待解决的问题。LntonAIServer工业排污检测算法应运而生&#x…

开发电商ERP系统需要接入哪些平台API?

跟随全渠道发展趋势&#xff0c;很多实体商家开设电商店铺&#xff0c;为消费者提供便捷的购物体验&#xff0c;增强消费者的满意度&#xff0c;同时也提升了企业自身的市场竞争力。为了满足商家业务拓展需求&#xff0c;很多原本主要服务于实体商贸企业的ERP服务商&#xff0c…

CSS filter(滤镜)属性,并实现页面置灰效果

目录 一、filter&#xff08;滤镜&#xff09;属性 二、准备工作 三、常用的filter属性值 1、blur(px) 2、brightness(%) 3、contrast(%) 4、grayscale(%) 5、opacity(%) 6、saturate(%) 7、sepia(%) 8、invert(%) 9、hue-rotate(deg) 10、drop-shadow(h-shadow v…

嵌入式软件的中断测试

嵌入式软件中断测试是确保嵌入式系统可靠性和稳定性的重要环节。中断是嵌入式系统中常见的一种机制&#xff0c;用于处理外部事件或系统内部的紧急任务。由于中断的实时性和并发性&#xff0c;中断测试对于发现潜在的软件缺陷和确保系统按预期响应中断至关重要。 嵌入式软件中…

编译rust程序,并让它依赖低版本的GLIBC库

在linux环境下编译rust程序,编译好的程序会依赖你当前系统的GLIBC库,也就是说你的程序无法在使用更低版本GLIBC库的linux系统中运行。 查看当前系统的GLIBC版本: strings /lib64/libc.so.6 | grep GLIBC 为了让编译的程序依赖比较低版本的GLIBC库,我们最好在centos7下编译…

JavaScript基础-函数(完整版)

文章目录 函数基本使用函数提升函数参数arguments对象&#xff08;了解&#xff09;剩余参数(重点)展开运算符(...) 逻辑中断函数参数-默认参数函数返回值-return作用域(scope)全局作用域局部作用域变量的访问原则垃圾回收机制闭包 匿名函数函数表达式立即执行函数 箭头函数箭头…

vite typescript 配置跨域代理

打开工程目录下vite.config.ts文件 export default defineConfig({plugins: [vue(), topLevelAwait()],resolve: { alias },server:{proxy:{/api:{ //对以 /api 开头的请求跨域处理target:http://xxx.xxx.cn,//目标服务器changeOrigin: true,rewrite:(path)>{return path.…

软件测试面试题:怎么优化SQL的查询速度?

索引优化&#xff1a;确保查询中用到的字段上有合适的索引。索引可以显著加快数据检索速度&#xff0c;但也要注意不要过度索引&#xff0c;因为索引虽然可以加快查询速度&#xff0c;但会降低更新表的速度。 查询语句优化&#xff1a;避免使用SELECT *&#xff0c;尽量指定需…

【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战

目录 一、引言 二、模型简介 2.1 Gemma2概述 2.2 Gemma2 模型架构 三、训练与推理 3.1 Gemma2 模型训练 3.1.1 下载基座模型 3.1.2 导入依赖库 3.1.3 量化配置 3.1.4 分词器和模型实例化 3.1.5 引入PEFT进行LORA配置 3.1.6 样本数据清洗与加载 3.1.7 模型训练与保…

SCI一区TOP|徒步优化算法(HOA)原理及实现【免费获取Matlab代码】

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献5.代码获取 1.背景 2024年&#xff0c;SO Oladejo受到徒步旅行启发&#xff0c;提出了徒步优化算法&#xff08;Hiking Optimization Algorithm, HOA&#xff09;。 2.算法原理 2.1算法思想 HOA灵感来自于…

vue3 websocket连接上了,会自动断开的处理的二种方式

上了服务器以后&#xff0c;发现websocket会自动断开&#xff0c;那么我们可以有二种方法&#xff1a; 1&#xff09;一般我们会发送心跳包 function sendMessagePing() {if (websocket && websocket.readyState WebSocket.OPEN) {websocket.send(ping);} else {con…

小试牛刀-Solana合约账户详解

目录 一.Solana 三.账户详解 3.1 程序账户 3.2 系统所有账户 3.3 程序派生账户(PDA) 3.4 Token账户 四、相关学习文档 五、在线编辑器 Welcome to Code Blocks blog 本篇文章主要介绍了 [Solana合约账户详解] ❤博主广交技术好友&#xff0c;喜欢文章的可以关注一下❤ …

【人工智能】--生成对抗网络

个人主页&#xff1a;欢迎来到 Papicatch的博客 课设专栏 &#xff1a;学生成绩管理系统 专业知识专栏&#xff1a; 专业知识 文章目录 &#x1f349;引言 &#x1f349;GAN 的基本原理 &#x1f348;生成器&#xff08;Generator&#xff09; &#x1f348;判别器&…

sql语句练习注意点

1、时间可以进行排序&#xff0c;也可以用聚合函数对时间求最大值max&#xff08;时间&#xff09; 例如下面的例子&#xff1a;取最晚入职的人&#xff0c;那就是将入职时间倒序排序&#xff0c;然后limit 1 表&#xff1a; 场景&#xff1a;查找最晚入职员工的所有信息 se…

docker compose方式部署Zabbix 7.0 LTS

docker compose方式部署 Zabbix 7.0 LTS Zabbix 由几个主要的功能组件组成 zabbix-server 是 Zabbix agent 向其报告可用性、系统完整性信息和统计信息的核心组件。zabbix-agent 部署在被监控目标上&#xff0c;用于主动监控本地资源和应用程序&#xff0c;并将收集的数据发送…

Miniconda安装教程

文章目录 Conda和Miniconda的区别一、安装 Miniconda 1、创建目录2、下载 Miniconda&#xff08;Python3 版本&#xff09;3、安装 Miniconda4、取消默认进入conda&#xff08;base&#xff09;环境5、配置 conda 国内镜像 二、创建 Python3.8 环境 1、创建指令2、激活 py38 环…

Pinia:Vue 2 和 Vue 3 中更好用的状态管理框架

前言 还在用Vuex? 在Vue应用程序的开发过程中&#xff0c;高效且易于维护的状态管理一直是开发者关注的核心问题之一。随着Vue 3的发布&#xff0c;状态管理领域迎来了一位新星——Pinia&#xff0c;它不仅为Vue 3量身打造&#xff0c;同时也向下兼容Vue 2&#xff0c;以其简…

ios调用高德地图定位报错

错误信息如下&#xff1a; Thread Performance Checker: Thread running at User-interactive quality-of-service class waiting on a lower QoS thread running at Default quality-of-service class. Investigate ways to avoid priority inversions PID: 1668, TID: 1538…