首页 > 代码库 > Python 学习笔记- hashlib模块

Python 学习笔记- hashlib模块

Python里面可以通过hashlib来加密文件。hashlib可以支持多种加密,以最常见的md5为例,我们可以用来加密用户的输入密码,然后保存在数据库里。


例1 加密字符串

import hashlib
obj = hashlib.md5(bytes(‘1111‘, encoding=‘utf-8‘))
obj=hashlib.md5()
obj.update(bytes(‘123‘, encoding=‘utf8‘))
obj.update(bytes(‘456‘,encoding=‘utf8‘))
result = obj.hexdigest()
print(obj)
print(obj.digest())
print(result)
----------------
<md5 HASH object @ 0x101d839b0>
b‘\xe1\n\xdc9I\xbaY\xab\xbeV\xe0W\xf2\x0f\x88>‘
e10adc3949ba59abbe56e057f20f883e


值得注意的有几点:

  1. 首先通过hashlib.md5()生成一个对象;然后调用这个对象的方法update去生成对应的md5 checksum,然后打印出来;

  2. 我对字符串‘123’,‘456’的字节分别执行了update的操作,那么最后他的md5结果和‘123456’的字节其实是一样的。通过类似的方法,我们可以把一个很大的文件分字节的读入。

  3. hexdigest()和digest()的区别 前者输出的是2进制 后者是一个16进制的摘要

  4. 因为md5可以通过撞库来破解,因此可以通过 obj=hashlib.md5(bytes(‘111‘,encoding=‘utf8))再加一次密,这样撞库的几率就大为降低了。


例2 加密文件

import hashlib
def md5(fname):
    hash_md5 = hashlib.md5()
    with open(fname, "rb") as f:
        for chunk in iter(lambda: f.read(4096), b""):
            hash_md5.update(chunk)
    return hash_md5.hexdigest()
dd=md5(‘index.py‘)
print(dd)
-----------------------
06fd2a2b98ff2e333bc9861dfb8048de

注意事项:

因为文件可能很大,所以每次只读取4096个字节进行转换。最后返回最终的md5 checksum。

注意这一句 iter()的使用,第一个参数是返回的f.read(4096)个字节码的迭代器,第二个参数b"" 表示直到这个参数才迭代结束,换句话说相当于一个循环,每次读取4096个字节码,直到为空

for chunk in iter(lambda: f.read(4096), b"")


最后的MD5结果和我直接在OSX Shell里面操作是一样的

jip-ise:week6 yli$ md5 index.py 
MD5 (index.py) = 06fd2a2b98ff2e333bc9861dfb8048de



本文出自 “麻婆豆腐” 博客,请务必保留此出处http://beanxyz.blog.51cto.com/5570417/1854933

Python 学习笔记- hashlib模块