首页 > 代码库 > python初步——基础总结(一)
python初步——基础总结(一)
一. 第一个HelloWorld
1. 在linux 执行 (python2.7)
[root@linux-node1 ~]# vim test.py #!/usr/bin/env python #---->python解释器 # -*- coding: utf-8 -*- # ---> 字符集 print ‘Hello World‘
执行结果
# python test.py Hello World
2. 在windows pycharm 上执行
print(‘Hello World‘)
执行结果
Hello World
二. 变量
1. 声明变量
name = ‘Sam‘ print(name)
name 为变量名,‘Sam‘ 为变量名的值
2. 变量名命名规则
变量名只能是 字母、数字或下划线的任意组合
变量名的第一个字符不能是数字
以下关键字不能声明为变量名
[‘and‘, ‘as‘, ‘assert‘, ‘break‘, ‘class‘, ‘continue‘, ‘def‘, ‘del‘, ‘elif‘, ‘else‘, ‘except‘, ‘exec‘, ‘finally‘, ‘for‘, ‘from‘, ‘global‘, ‘if‘, ‘import‘, ‘in‘, ‘is‘, ‘lambda‘, ‘not‘, ‘or‘, ‘pass‘, ‘print‘, ‘raise‘, ‘return‘, ‘try‘, ‘while‘, ‘with‘, ‘yield‘]
三. 字符集编码
python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)
1. ascill
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号。
2. 中文
big5 处理繁体中文
GB2312 1980年一共收录了7445个字符,包括6763个汉字和682个其它符号。
GBK 1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符
GB18030 2000年的 GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。
GB2312 GBK GB18030 占两个字节,并且能够向下兼容 GB18030 --> GBK --> GB2312 --> ASCILL
3. unicode
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536
4. UTF-8
UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存
案例
ascill 无法识别中文,会报错
[root@linux-node1 ~]#!/usr/bin/env python print ‘你好世界‘
告诉解释器,用支持中文的编码执行
[root@linux-node1 ~]#!/usr/bin/env python # -*- coding: utf-8 -*- print ‘你好世界‘
四. 注释
单行注释:# 代码是内容
快捷键: Ctrl + /
多行注释:‘‘‘内容‘‘‘ 或者 """内容"""
五. 用户输入
[root@linux-node1 ~]# cat test.py #!/usr/bin/env python # -*- coding: gbk -*- #name = raw_input(‘pls input your name:‘) # python 2.X name = input(‘pls input your name:‘) # python 3.X print name
[root@linux-node1 ~]# python test.py pls input your name:高哨兵 高哨兵
注: input (2.X)==eval(input) (3.X)
raw_input 2.X == input 3.X
输入密码时,如果想要不可见,需要利用getpass 模块中的 getpass方法
[root@linux-node1 ~]# cat test.py #!/usr/bin/env python # -*- coding: gbk -*- import getpass password = getpass.getpass(‘pls input your password:‘) print password
[root@linux-node1 ~]# python test.py pls input your password: 123456
六. 模块
1. sys
1.1 sys.argv
[root@linux-node1 ~]# cat test.py #!/usr/bin/env python # -*- coding: gbk -*- import sys print sys.argv # 参数列表 print sys.argv[0] print sys.argv[1]
[root@linux-node1 ~]# python test.py aa bb [‘test.py‘, ‘aa‘, ‘bb‘] test.py aa
1.2 sys.path
[root@linux-node1 ~]# cat test.py #!/usr/bin/env python # -*- coding: gbk -*- import sys print sys.path #打印环境变量
[root@linux-node1 ~]# python test.py [‘/root‘, ‘/usr/lib64/python27.zip‘, ‘/usr/lib64/python2.7‘, ‘/usr/lib64/python2.7/plat-linux2‘, ‘/usr/lib64/python2.7/lib-tk‘, ‘/usr/lib64/python2.7/lib-old‘, ‘/usr/lib64/python2.7/lib-dynload‘, ‘/usr/lib64/python2.7/site-packages‘, ‘/usr/lib/python2.7/site-packages‘]
2. OS
2.1 os.system
[root@linux-node1 ~]# cat test.py #!/usr/bin/env python # -*- coding: gbk -*- import os result = os.system(‘ifconfig eth0‘) print result
[root@linux-node1 ~]# python test.py # os.system(‘ifconfig eth0‘) eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 192.168.130.128 netmask 255.255.255.0 broadcast 192.168.130.255 inet6 fe80::20c:29ff:fec1:295a prefixlen 64 scopeid 0x20<link> ether 00:0c:29:c1:29:5a txqueuelen 1000 (Ethernet) RX packets 180648 bytes 20405707 (19.4 MiB) RX errors 0 dropped 0 overruns 0 frame 0 TX packets 29076 bytes 2468508 (2.3 MiB) TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 # print result 0
2.2 os.popen
#!/usr/bin/env python # -*- coding: gbk -*- import os result = os.popen(‘ifconfig eth0‘).read() print result
[root@linux-node1 ~]# python test.py # print result eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 192.168.130.128 netmask 255.255.255.0 broadcast 192.168.130.255 inet6 fe80::20c:29ff:fec1:295a prefixlen 64 scopeid 0x20<link> ether 00:0c:29:c1:29:5a txqueuelen 1000 (Ethernet) RX packets 181087 bytes 20441778 (19.4 MiB) RX errors 0 dropped 0 overruns 0 frame 0 TX packets 29291 bytes 2531300 (2.4 MiB) TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
3. 把参数当作命令执行
[root@linux-node1 ~]# cat test.py #!/usr/bin/env python # -*- coding: gbk -*- import os,sys os.system(‘ ‘.join(sys.argv[1:]))
[root@linux-node1 ~]# python test.py ifconfig eth0 eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 192.168.130.128 netmask 255.255.255.0 broadcast 192.168.130.255 inet6 fe80::20c:29ff:fec1:295a prefixlen 64 scopeid 0x20<link> ether 00:0c:29:c1:29:5a txqueuelen 1000 (Ethernet) RX packets 181757 bytes 20497644 (19.5 MiB) RX errors 0 dropped 0 overruns 0 frame 0 TX packets 29679 bytes 2669636 (2.5 MiB) TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
4. 自己的模块
[root@linux-node1 ~]# cat test.py #!/usr/bin/env python print ‘Hello World!‘
[root@linux-node1 ~]# cat test2.py #!/usr/bin/env python import test
[root@linux-node1 ~]# python test2.py Hello World!
注:test.py 必须放在环境变量的目录里,可使用print sys.path 查询,一般放在当前目录或者放在E:\Python36\Lib\site-packages 目录下
七. 认识.pyc
1. Python是一门解释型语言?
我初学Python时,听到的关于Python的第一句话就是,Python是一门解释性语言,我就这样一直相信下去,直到发现了*.pyc文件的存在。如果是解释型语言,那么生成的*.pyc文件是什么呢?c应该是compiled的缩写才对啊!
为了防止其他学习Python的人也被这句话误解,那么我们就在文中来澄清下这个问题,并且把一些基础概念给理清。
2. 解释型语言和编译型语言
计算机是不能够识别高级语言的,所以当我们运行一个高级语言程序的时候,就需要一个“翻译机”来从事把高级语言转变成计算机能读懂的机器语言的过程。这个过程分成两类,第一种是编译,第二种是解释。
编译型语言在程序执行之前,先会通过编译器对程序执行一个编译的过程,把程序转变成机器语言。运行时就不需要翻译,而直接执行就可以了。最典型的例子就是C语言。
解释型语言就没有这个编译的过程,而是在程序运行的时候,通过解释器对程序逐行作出解释,然后直接运行,最典型的例子是Ruby。
通过以上的例子,我们可以来总结一下解释型语言和编译型语言的优缺点,因为编译型语言在程序运行之前就已经对程序做出了“翻译”,所以在运行时就少掉了“翻译”的过程,所以效率比较高。但是我们也不能一概而论,一些解释型语言也可以通过解释器的优化来在对程序做出翻译时对整个程序做出优化,从而在效率上超过编译型语言。
此外,随着Java等基于虚拟机的语言的兴起,我们又不能把语言纯粹地分成解释型和编译型这两种。
用Java来举例,Java首先是通过编译器编译成字节码文件,然后在运行时通过解释器给解释成机器文件。所以我们说Java是一种先编译后解释的语言。
3. Python到底是什么
其实Python和Java/C#一样,也是一门基于虚拟机的语言,我们先来从表面上简单地了解一下Python程序的运行过程吧。
当我们在命令行中输入python hello.py时,其实是激活了Python的“解释器”,告诉“解释器”:你要开始工作了。可是在“解释”之前,其实执行的第一项工作和Java一样,是编译。
熟悉Java的同学可以想一下我们在命令行中如何执行一个Java的程序:
javac hello.java
java hello
只是我们在用Eclipse之类的IDE时,将这两部给融合成了一部而已。其实Python也一样,当我们执行python hello.py时,他也一样执行了这么一个过程,所以我们应该这样来描述Python,Python是一门先编译后解释的语言。
4. 简述Python的运行过程
在说这个问题之前,我们先来说两个概念,PyCodeObject和pyc文件。
我们在硬盘上看到的pyc自然不必多说,而其实PyCodeObject则是Python编译器真正编译成的结果。我们先简单知道就可以了,继续向下看。
当python程序运行时,编译的结果则是保存在位于内存中的PyCodeObject中,当Python程序运行结束时,Python解释器则将PyCodeObject写回到pyc文件中。
当python程序第二次运行时,首先程序会在硬盘中寻找pyc文件,如果找到,则直接载入,否则就重复上面的过程。
所以我们应该这样来定位PyCodeObject和pyc文件,我们说pyc文件其实是PyCodeObject的一种持久化保存方式。
八. 数据类型
1、数字
int(整型)
在32位机器上,整数的位数为32位,取值范围为-2**31~2**31-1,即-2147483648~2147483647
在64位系统上,整数的位数为64位,取值范围为-2**63~2**63-1,即-9223372036854775808~9223372036854775807
long(长整型)
跟C语言不同,Python的长整数没有指定位宽,即:Python没有限制长整数数值的大小,但实际上由于机器内存有限,我们使用的长整数数值不可能无限大。
注意,自从Python2.2起,如果整数发生溢出,Python会自动将整数数据转换为长整数,所以如今在长整数数据后面不加字母L也不会导致严重后果了。pyhton 3X没有长整型
float(浮点型)
先扫盲 http://www.cnblogs.com/alex3714/articles/5895848.html
浮点数用来处理实数,即带有小数的数字。类似于C语言中的double类型,占8个字节(64位),其中52位表示底,11位表示指数,剩下的一位表示符号。
complex(复数)
复数由实数部分和虚数部分组成,一般形式为x+yj,其中的x是复数的实数部分,y是复数的虚数部分,这里的x和y都是实数。
注:Python中存在小数字池:-5 ~ 257
2、布尔值
真或假
1 或 0
3、字符串
3.1 字符串格式化输出
>>> "I am %s, %d year old, I love %s" % (‘Sam‘,12, ‘dog‘) ‘I am Sam, 12 year old, I love dog‘
>>> "I am {}, {} year old, I love {}".format(‘Sam‘,12, ‘dog‘) ‘I am Sam, 12 year old, I love dog‘
>>> "I am {2}, {0} year old, I love {1}".format(12,‘dog‘, ‘Sam‘) ‘I am Sam, 12 year old, I love dog‘
>>> "I am {name}, {age} year old, I love {dong}".format(name=‘Sam‘,age=12, dong=‘dog‘) ‘I am Sam, 12 year old, I love dog‘
注:%s字符串,%d整型,%f浮点数
3.2 字符串方法
1--> 移除空白
str = ‘ ggggggggggg \n‘ print(str) print(str.strip()) print(str.lstrip()) print(str.rstrip()) print(‘````````````‘)
结果
ggggggggggg ggggggggggg ggggggggggg ggggggggggg ````````````
2--> 分割
print(‘i am a boy, are you ok?‘.split(‘a‘))
结果
[‘i ‘, ‘m ‘, ‘ boy, ‘, ‘re you ok?‘]
3--> 长度
str = ‘i am a boy, are you ok?‘ print(len(str))
结果
23
4--> 索引
>>> ‘i am a boy, are you ok?‘.index(‘you‘) 16 >>> ‘i am a boy, are you ok?‘.index(‘a‘) 2
5--> 切片
>>> str=‘i am a boy, are you ok?‘ >>> str[5] ‘a‘ >>> str[5:] ‘a boy, are you ok?‘ >>> str[-3:] ‘ok?‘ >>> str[-3:-6] ‘‘ >>> str[-3:-6:-1] ‘o u‘ >>> str[-3:-8:-1] ‘o uoy‘
6 --> 替代
>>> str.replace(‘a‘,‘B‘) ‘i Bm B boy, Bre you ok?‘
注:还有很多方法,暂不一一总结
4. 列表
4.1 创建列表
>>> name = [‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘] >>> type(name) <type ‘list‘> >>> name=list([‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘]) >>> type(name) <type ‘list‘> >>> name = [] >>> type(name) <type ‘list‘> >>> name = list() >>> type(name) <type ‘list‘>
4.2 列表方法(大部分方法与字符串一样)
1--> 索引
>>> name=list([‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘]) >>> name.index(‘jey‘) 3
2 --> 切片 (与字符串一样)
3--> 追加
>>> name.append(‘hao‘) >>> name [‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘, ‘hao‘]
4--> 删除
>>> name [‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘, ‘hao‘] >>> del name[1] >>> name [‘gao‘, ‘snow‘, ‘jey‘, ‘hao‘]
>>> name [‘gao‘, ‘snow‘, ‘jey‘, ‘hao‘] >>> name.remove(‘gao‘) >>> name [‘snow‘, ‘jey‘, ‘hao‘]
5 --> 长度
>>> name [‘snow‘, ‘jey‘, ‘hao‘] >>> len(name) 3
6 --> 循环
>>> for i in name: ... print i ... snow jey hao
注:还有很多方法,暂不一一总结
5. 元组(不可变列表)
>>> name=(‘Sam‘, ‘Jey‘, ‘Snow‘) >>> type(name) <type ‘tuple‘> >>> name=tuple((‘Sam‘, ‘Jey‘, ‘Snow‘)) >>> type(name) <type ‘tuple‘>
6. 字典(无序的)
>>> person = {‘name‘: ‘Sam‘, ‘age‘: 23} >>> type(person) <type ‘dict‘> >>> person = dict({‘name‘: ‘Sam‘, ‘age‘: 23}) >>> type(person) <type ‘dict‘>
九. 数据运算
算数运算:
比较运算:
赋值运算:
逻辑运算:
成员运算:
身份运算:
位运算:
运算符优先级:
十. if if...else if...elif..else
1. if .. else
username = input(‘pls enter your username:‘) password = input(‘pls enter your password:‘) if username == ‘sam‘ and password == ‘123456‘: print(‘now login......‘) else: print(‘invalid username or passwod‘)
2. if ... elif ..else
number = int(input(‘pls enter your number:‘)) if number == 50: print(‘you are right...‘) elif number > 50: print(‘too big‘) else: print(‘too small....‘)
十一. while
1. while True
while True: number = int(input(‘pls enter your number:‘)) if number == 50: print(‘you are right...‘) break elif number > 50: print(‘too big‘) else: print(‘too small....‘)
2. while <表达式>
count = 1 while count > 3: number = int(input(‘pls enter your number:‘)) if number == 50: print(‘you are right...‘) elif number > 50: print(‘too big‘) else: print(‘too small....‘) count += 1
十二. for
for i in range(2,12): print(‘number:‘, i)
结果
number: 2 number: 3 number: 4 number: 5 number: 6 number: 7 number: 8 number: 9 number: 10 number: 11
十二. bytes类型
以下内容取自http://www.cnblogs.com/zanjiahaoge666/p/6402907.html
标题:Python3中内置类型bytes和str用法及byte和string之间各种编码转换
python3最重要的新特性大概要算对文本和二进制数据做了更为清晰的区分,文本总是unicode字符集,有str类型表示,二进制数据则有bytes类型表示。python3不会以任何隐式的方式混用str和bytes,正是这是的这两者的区别特别明显,你不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反之亦然);
我们不关心字符串在内部是如何被表示的,也不关心它用几个字节来表示每个字符。只有在将字符串编码成字节(如用于通信信道的传输)或将字节解码成字符串时,才考虑这些问题。
1. 创建bytes类型数据
>>> a = bytes([1,2,3,4]) >>> a b‘\x01\x02\x03\x04‘ >>> type(a) <class ‘bytes‘> >>> >>> a = bytes(‘hello‘,‘ascii‘) >>> >>> a b‘hello‘ >>> type(a) <class ‘bytes‘>
2. 编码可以将抽象字符以二进制数据的形式表示,有很多编码方法,如utf-8、gbk等,可以使用encode()函数对字符串进行编码,转换成二进制字节数据,也可用decode()函数将字节解码成字符串;用decode()函数解码,可不要用指定编码格式;
>>> a = ‘hello world‘ >>> type(a) <class ‘str‘> >>> a ‘hello world‘
a. 按utf-8的方式编码,转成bytes:以及解码成字符串
>>> b = a.encode(encoding=‘utf-8‘) >>> type(b) <class ‘bytes‘> >>> >>> b b‘hello world‘ >>> >>> >>> c = b.decode(encoding=‘utf-8‘) >>> type(c) <class ‘str‘> >>> c ‘hello world‘ >>>
b. 按gbk的方式编码,转成bytes:以及解码成字符串
>>> x = a.encode(encoding=‘gbk‘) >>> type(x) <class ‘bytes‘> >>> >>> x b‘hello world‘ >>> >>> y = x.decode() >>> type(y) <class ‘str‘> >>> >>> y ‘hello world‘ >>>
十三. 三元运算
>>> grilF = ‘Snow‘ if 2 > 1 else ‘Jey‘ >>> grilF ‘Snow‘ >>> grilF = ‘Snow‘ if 2 < 1 else ‘Jey‘ >>> grilF ‘Jey‘
python初步——基础总结(一)