首页 > 代码库 > python15 - day06 模块

python15 - day06 模块

通往财富自由之路

1. 模块

1.1  random随机数

使用方法

import random

print(random.random())

print(random.randint(1,10))    #随机数包括10


print(random.randrange(1,10))    #随机数不包括10

 技术分享

 

练习:生成随机验证码

import random

checkcode = ‘‘

for i in range(4):

    current = random.randrange(0,4)

    if current != i:

        temp = chr(random.randint(65,90))

    else:

        temp = random.randint(0,9)

    checkcode += str(temp)

print checkcode

 

#生成字母和数字组合的6位随机数

import  string
import  random

str_source = string.ascii_letters + string.digits
print(‘‘.join(random.sample(str_source,6)))

 

1.2  OS模块

os.getcwd()       #获取当前工作目录,即当前python脚本工作的目录路径

os.chdir("dirname")    #改变当前脚本工作目录;相当于shell下cd

os.curdir               #返回当前目录: (‘.‘)

os.pardir              #获取当前目录的父目录字符串名:(‘..‘)

os.makedirs(‘dirname1/dirname2‘)            #可生成多层递归目录

os.removedirs(‘dirname1‘)      #若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推

os.mkdir(‘dirname‘)       #生成单级目录;相当于shell中mkdir dirname

os.rmdir(‘dirname‘)    #删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname

os.listdir(‘dirname‘)    #列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印

os.remove()               #删除一个文件

os.rename("oldname","newname")         #重命名文件/目录

os.stat(‘path/filename‘)           #获取文件/目录信息

os.sep         #输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"

os.linesep    #输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"

os.pathsep    #输出用于分割文件路径的字符串

os.name    #输出字符串指示当前使用平台。win->‘nt‘; Linux->‘posix‘

os.system("bash command")           #运行shell命令,直接显示

os.environ                           #获取系统环境变量

os.path.abspath(path)               #返回path规范化的绝对路径

os.path.split(path)           #将path分割成目录和文件名二元组返回

os.path.dirname(path)  #返回path的目录。其实就是os.path.split(path)的第一个元素

os.path.basename(path)  #返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素

os.path.exists(path)  #如果path存在,返回True;如果path不存在,返回False

os.path.isabs(path)          #如果path是绝对路径,返回True

os.path.isfile(path)  #如果path是一个存在的文件,返回True。否则返回False

os.path.isdir(path)  #如果path是一个存在的目录,则返回True。否则返回False

os.path.join(path1[, path2[, ...]])  #将多个路径组合后返回,第一个绝对路径之前的参数将被忽略

os.path.getatime(path)     #返回path所指向的文件或者目录的最后存取时间

os.path.getmtime(path)     #返回path所指向的文件或者目录的最后修改时间

1.3  sys模块 

sys.argv               命令行参数List,第一个元素是程序本身路径

sys.exit(n)            退出程序,正常退出时exit(0)

sys.version            获取Python解释程序的版本信息

sys.maxint             最大的Int值

sys.path         返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值

sys.platform                  返回操作系统平台名称

sys.stdout.write(‘please:‘)

val = sys.stdin.readline()[:-1]

 1.4 json & pickle序列化

    把一个内存对象转换成字符串形式就叫做序列化,把一个字符串转换为对应的内存对象就叫做反序列化。

    我们打开一个文件,只能存储字符串或byte类型的对象,而我们定义的字典、列表等都是内存的表现形式,磁盘不认识这个对象,不能存储进磁盘。

 技术分享

 

json,用于字符串和python数据类型间进行转换

pickle,用于python特有的类型 和 python的数据类型间进行转换

Json模块提供了四个功能:dumps、dump、loads、load

pickle模块提供了四个功能:dumps、dump、loads、load

json.dump和json.dumps很不同,json.dump主要用来json文件读写,和json.load函数配合使用。json.dump(x,f),x是对象,f是一个文件对象,这个方法可以将json字符串写入到文本文件中。

 技术分享

1.5 shelve 持久化

shelve模块是一个简单的key-value将内存数据通过文件持久化的模块,类似于字典,但是它的key只可以是字符串类型数据,可以持久化任何pickle可支持的python数据格式。与pickle不同的是pickle模块down一次,只能load一次,而shelve可以支持多次load。

例如:存储数据

import shelve
d = shelve.open("shelve.txt")          #shelve模式打开一个文件
def stu(name,age):
    print("register stu",name,age)
name = ["alex","kaige","water"]
info = {"name":"alex","age":22}

d["test"] = name      #存储一个key为test,value为name列表的数据
d["info"] = info      #存储一个key为info,value为info字典的数据
d["func"] = stu       #存储一个key为func,value为函数内存地址的数据

 

读取数据:

import shelve
#这里需要重新定义一个函数,因为我们在下边读取文件的函数,而之前存储的是函数的内存地址,这里从内存读出来的地址里并没有这个函数,所以需要重新定义一个函数。
def stu(name,age):
    print("stu:%s,age:%s"%(name,age))


f = shelve.open("shelve.txt")
print(f["test"])
print(f["info"])
print(f["func"]("liangkai",22))

1.6 xml处理模块

xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单,不过,古时候,在json还没诞生的黑暗年代,大家只能选择用xml呀,至今很多传统公司如金融行业的很多系统的接口还主要是xml。

<?xml version="1.0"?>

<data>

    <country name="Liechtenstein">

        <rank updated="yes">2</rank>

        <year>2008</year>

        <gdppc>141100</gdppc>

        <neighbor name="Austria" direction="E"/>

        <neighbor name="Switzerland" direction="W"/>

    </country>

    <country name="Singapore">

        <rank updated="yes">5</rank>

        <year>2011</year>

        <gdppc>59900</gdppc>

        <neighbor name="Malaysia" direction="N"/>

    </country>

    <country name="Panama">

        <rank updated="yes">69</rank>

        <year>2011</year>

        <gdppc>13600</gdppc>

        <neighbor name="Costa Rica" direction="W"/>

        <neighbor name="Colombia" direction="E"/>

    </country>

</data>

 

xml协议在各个语言里的都 是支持的,在python中可以用以下模块操作xml  

import xml.etree.ElementTree as ET

 

tree = ET.parse("xmltest.xml")

root = tree.getroot()

print(root.tag)

 

#遍历xml文档

for child in root:

    print(child.tag, child.attrib)

    for i in child:

        print(i.tag,i.text)

 

#只遍历year 节点

for node in root.iter(year):

    print(node.tag,node.text) 

 

修改和删除xml文档内容

import xml.etree.ElementTree as ET

 

tree = ET.parse("xmltest.xml")

root = tree.getroot()

 

#修改

for node in root.iter(year):

    new_year = int(node.text) + 1

    node.text = str(new_year)

    node.set("updated","yes")

 

tree.write("xmltest.xml")

 

 

自己创建xml文档

import xml.etree.ElementTree as ET

new_xml = ET.Element("namelist")

name = ET.SubElement(new_xml,"name",attrib={"enrolled":"yes"})

age = ET.SubElement(name,"age",attrib={"checked":"no"})

sex = ET.SubElement(name,"sex")

sex.text = 33

name2 = ET.SubElement(new_xml,"name",attrib={"enrolled":"no"})

age = ET.SubElement(name2,"age")

age.text = 19

 

et = ET.ElementTree(new_xml) #生成文档对象

et.write("test.xml", encoding="utf-8",xml_declaration=True)

 

ET.dump(new_xml) #打印生成的格式

 

1.7 ConfigParser模块

用于生成和修改常见配置文档,当前模块的名称在 python 3.x 版本中变更为 configparser。来看一个好多软件的常见配置文件格式

[DEFAULT]

ServerAliveInterval = 45

Compression = yes

CompressionLevel = 9

ForwardX11 = yes

 

[bitbucket.org]

User = hg

 

[topsecret.server.com]

Port = 50022

ForwardX11 = no

 

练习使用python生成配置文档:

import configparser
conf = configparser.ConfigParser()
conf["default"] = {"name":"water",
                   "port":"22",
                   "dirctor":"etc"}
conf["test.org"] = {}
conf["test.org"]["name"] = "test"
with open("conf.ini","w") as configfile:
    conf.write(configfile)

 

生成结果:

[default]
name = water
dirctor = etc
port = 22

[test.org]
name = test

 

1.8 hashlib加密

用于加密相关的操作,3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法

import hashlib

m = hashlib.md5()
m.update(b"Hello")
m.update(b"It‘s me")
print(m.digest())
m.update(b"It‘s been a long time since last time we ...")

print(m.digest())  # 2进制格式hash
print(len(m.hexdigest()))  # 16进制格式hash
‘‘‘
def digest(self, *args, **kwargs): # real signature unknown
    """ Return the digest value as a string of binary data. """
    pass

def hexdigest(self, *args, **kwargs): # real signature unknown
    """ Return the digest value as a string of hexadecimal digits. """
    pass

‘‘‘
import hashlib

# ######## md5 ########

hash = hashlib.md5()
hash.update(admin)
print(hash.hexdigest())

# ######## sha1 ########

hash = hashlib.sha1()
hash.update(admin)
print(hash.hexdigest())

# ######## sha256 ########

hash = hashlib.sha256()
hash.update(admin)
print(hash.hexdigest())

# ######## sha384 ########

hash = hashlib.sha384()
hash.update(admin)
print(hash.hexdigest())

# ######## sha512 ########

hash = hashlib.sha512()
hash.update(admin)
print(hash.hexdigest())

python 还有一个 hmac 模块,它内部对我们创建 key 和 内容 再进行处理然后再加密

import hmac

h = hmac.new(wueiqi)

h.update(hellowo)

print h.hexdigest()  

1.9 re正则表达式   

常用正则表达式符号

‘.‘    默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行

‘^‘    匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)

‘$‘    匹配字符结尾,或e.search("foo$","bfoo\nsdfsf",flags=re.MULTILINE).group()也可以

‘*‘    匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac")  结果为[‘abb‘, ‘ab‘, ‘a‘]

‘+‘    匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果[‘ab‘, ‘abb‘]

‘?‘    匹配前一个字符1次或0次

‘{m}‘   匹配前一个字符m次

‘{n,m}‘   匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果‘abb‘, ‘ab‘, ‘abb‘]

‘|‘    匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果‘ABC‘

‘(...)‘ 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c

‘\A‘    只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的

‘\Z‘    匹配字符结尾,同$

‘\d‘    匹配数字0-9

‘\D‘    匹配非数字

‘\w‘    匹配[A-Za-z0-9]

‘\W‘    匹配非[A-Za-z0-9]

‘s‘     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 ‘\t‘

 

‘(?P<name>...)‘   分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{‘province‘: ‘3714‘, ‘city‘: ‘81‘, ‘birthday‘: ‘1993‘}

  

最常用的匹配语法

re.match           从头开始匹配

re.search          匹配包含

re.findall         把所有匹配到的字符放到以列表中的元素返回

re.splitall        以匹配到的字符当做列表分隔符

re.sub        匹配字符并替换

反斜杠的困扰:
    与大多数编程语言相同,正则表达式里使用"\"作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r"\\"表示。同样,匹配一个数字的"\\d"可以写成r"\d"。有了原生字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。

仅需轻轻知道的几个匹配模式:

re.I(re.IGNORECASE): 忽略大小写(括号内是完整写法,下同)

M(MULTILINE): 多行模式,改变‘^‘和‘$‘的行为(参见上图)

S(DOTALL): 点任意匹配模式,改变‘.‘的行为

1.10 time

import time
print(time.process_time())
print(time.altzone/3600)
print(time.asctime())
print(time.localtime())
print(time.gmtime())

print(time.asctime(time.localtime()))
print(time.ctime())

string = time.strptime("16/05/22","%y/%m/%d")
print(string)
time2 = time.mktime(string)

print(time.gmtime(time2))

 

作业:开发一个简单的python计算器

实现加减乘除及拓号优先级解析

用户输入 1 - 2 * ( (60-30 +(-40/5) * (9-2*5/3 + 7 /3*99/4*2998 +10 * 568/14 )) - (-4*3)/ (16-3*2) )等类似公式后,必须自己解析里面的(),+,-,*,/符号和公式(不能调用eval等类似功能偷懒实现),运算后得出结果,结果必须与真实的计算器所得出的结果一致

 

python15 - day06 模块