首页 > 代码库 > Python学习笔记12:标准库之对象序列化(pickle包,cPickle包)

Python学习笔记12:标准库之对象序列化(pickle包,cPickle包)

计算机的内存中存储的是二进制的序列。
我们能够直接将某个对象所相应位置的数据抓取下来,转换成文本流 (这个过程叫做serialize),然后将文本流存入到文件里。
因为Python在创建对象时,要參考对象的类定义,所以当我们从文本中读取对象时,必须在手边要有该对象的类定义,才干懂得怎样去重建这一对象。
从文件读取时,对于Python的内建(built-in)对象 (比方说整数、词典、表等等),因为其类定义已经加载内存,所以不须要我们再在程序中定义类。
但对于用户自行定义的对象,就必需要先定义类,然后才干从文件里加载对象。

一 pickle包

对于上述过程,最经常使用的工具是Python中的pickle包。

1 将内存中的对象转换成为文本流:

import pickle

class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
summer = Bird()
pickleString = pickle.dumps(summer) # serialize object

使用pickle.dumps()方法能够将对象summer转换成了字符串 picklestring(也就是文本流)。
随后我们能够用普通文本的存储方法来将该字符串储存在文件(文本文件的输入输出)。
import pickle

class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
summer = Bird()
fileName = 'save.pkl'
with open(fileName, 'w') as f: # open file with write-mode
    pickleString = pickle.dump(summer, f) # serialize and save object
对象summer存储在文件save.pkl

2 重建对象

首先,我们要从文本中读出文本,存储到字符串 (文本文件的输入输出)。
然后使用pickle.loads(str)的方法,将字符串转换成为对象。
要记得,此时我们的程序中必须已经有了该对象的类定义。
import pickle
 
# define the class before unpickle
class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
fileName = 'save.pkl'
with open(fileName, 'r') as f:
    summer = pickle.load(f) # read file and build object

二 cPickle包

cPickle包的功能和使用方法与pickle包差点儿全然同样,其存在区别的地方实际上非常少用到;
不同在于cPickle是基于c语言编写的,速度是pickle包的1000倍。
对于上面的样例,假设想使用cPickle包,我们都能够将import语句改为:
import cPickle as pickle
就不须要再做不论什么修改了。

Python学习笔记12:标准库之对象序列化(pickle包,cPickle包)