原标题:仅需10行代码,使用python加密用户敏感数据
数据分析师必须要遵守的一个规则就是数据保密,但在跨部门沟通的时候,难免会有数据泄露的情况,所以,对于用户的姓名、手机号、地址等敏感信息,一般需要加密传输,而最常用的算法就是md5算法。 下面举个例子,使用python把业务部门的excel信息转化为用md5加密的csv文件。
明文数据
MD5加密后的数据
需要使用的模块:
import pandas as pdimport hashlib
导入包之后,我们创建一个函数,首先把md5实例化
md = hashlib.md5()
之后把需要转化的字符串添加进去
md.update(x.encode())
最终输出转化后的数据
md_result = md.hexdigest()
基础函数写好之后开始操作excel部分:
def to_md5(file): df = pd.read_excel(file) columns = df.columns.tolist()[0] df[columns] = df[columns].astype('str') df[columns] = df[columns].apply(get_md5) print(df) df.to_csv('to_dm5.csv', index=False, encoding='utf_8_sig')
结果如下:
需要注意的有以下几点:
MD5只能转化字符串的数据,要转化手机号的话,需要先把手机号转化成字符串格式
pandas当中使用apply方法,接收的函数不用带括号。
以上简单几行代码,就可以完成我们工作中常用的数据加密需求。返回搜狐,查看更多
责任编辑: