首页 > 代码库 > Python开发系列【1】:初识Python
Python开发系列【1】:初识Python
Python简介
Python的前世今生:
Python诞生于1989年的圣诞节期间,其作者是吉多·范罗苏姆(Guido van Rossum)。当时Guido(江湖人称龟叔)在阿姆斯特丹度假时着手开发一个新的脚本解释程序,用以打发无聊时光。
如表1,在TIOBE社区发布的最新编程语言排行榜TIOBE index,Python稳居第五名,早已超越“宇宙最好语言PHP~”,其受欢迎程度不言而喻,而且由于且简洁容易入门,在美国、加拿大、澳大利亚等国家官方推荐14岁以上青年学习Python。
表1:TIOBE Index for March 2017
Mar 2017 | Mar 2016 | Change | Programming Language | Ratings | Change |
1 | 1 |
| Java | 16.384% | -4.14% |
2 | 2 |
| C | 7.742% | -6.86% |
3 | 3 |
| C++ | 5.184% | -1.54% |
4 | 4 |
| C# | 4.409% | +0.14% |
5 | 5 |
| Python | 3.919% | -0.34% |
6 | 7 | | Visual Basic .NET | 3.174% | +0.61% |
7 | 6 | | PHP | 3.009% | +0.24% |
8 | 8 |
| JavaScript | 2.667% | +0.33% |
9 | 11 | | Delphi/Object Pascal | 2.544% | +0.54% |
10 | 14 | | Swift | 2.268% | +0.68% |
11 | 9 | | Perl | 2.261% | +0.01% |
12 | 10 | | Ruby | 2.254% | +0.02% |
13 | 12 | | Assembly language | 2.232% | +0.39% |
14 | 16 | | R | 2.016% | +0.73% |
15 | 13 | | Visual Basic | 2.008% | +0.33% |
16 | 15 | | Objective-C | 1.997% | +0.54% |
17 | 48 | | Go | 1.982% | +1.78% |
18 | 18 |
| MATLAB | 1.854% | +0.66% |
19 | 19 |
| PL/SQL | 1.672% | +0.48% |
20 | 26 | | Scratch | 1.472% | +0.70% |
图1.TIOBE Programming Community Index
- 执行效率方面
Python最为人所诟病就是这点,为了说清楚这个话题,先来总结下当前的编程语言的编译解释类型。
从语言的执行角度可分为三类:
(1)编译型语言
代表选手:C/C++,delphi
指用专用的编译器,针对特定的操作平台(操作系统)将某种高级语言源代码一次性翻译成可被硬件平台直接运行的二进制机器码(具有操作数,指令、及相应的格式),这个过程叫做编译;编译好的可执行性文件(.exe),可在相对应的平台上运行(移植性差,但运行效率高)。
有些程序编译后,还需要把其他编译好的,可能需要组装两个以上的目标代码生成最终的可执行性文件,称为链接(可实现对低层次代码的复用)。
(2)解释型语言
代表选手:C#,VB,Python,Ruby
指用专门的解释器对源程序解释翻译为特定平台可识别的机器码。
解释型语言执行效率相对编译型较低且不能脱离解释器单独运行,但是跨平台移植性较好,只需对应的解释器即可。
另外,Java语言是一门很特殊的语言,Java程序需要进行编译步骤,但并不编译成特定平台的二进制机器码,而是编译后生成的是一种与平台无关的字节码文件(*.class)(移植性好的原因),这种字节码自然不能被平台直接执行,运行时需要由解释器(JVM)解释成相应平台的二进制机器码文件;所以说Java是一种介于编译型和解释型中间的语言。而Python和java的区别是,Python是边解释边执行的,并不是统一解释完了再执行。
(3)脚本语言
代表选手:Python,Javascript,PHP,Perl,Lua
定义:为了缩短传统的编写-编译-链接-运行(edit-compile-link-run)过程而创建的计算机编程语言。
它的特点是:程序代码即是最终的执行文件,只是这个过程需要解释器的参与,所以说脚本语言与解释型语言有很大的联系。脚本语言通常是被解释执行的,而且程序是文本文件。
总结:
理解了以上编程语言的分类和运行机制后,就大概明白了Python的执行效率会比C、C++、Java都慢的原因,这里还不得不提的一点是,Python语言的源码就是用C语言写的,甚至Python和Lua在这方面比也不占优势。
但是现在有很多针对于Python开发效率的优化,使其更适用于对开发效率较为敏感的HPC和大数据领域。比如今年2月份,Intel Distribution for Python 发布了update2版本,在四核 I5 的imac上测试的结果是提升了20倍的运行效率。
(详见在配备四核 i5 的 iMAC 上实现了 20 倍的性能加速!)
P.S.另外Python是动态型语言,可以在运行时改变自身结构。
2、开发效率方面
这方面是Python的强项。因为Python代码简洁到类似伪代码,并且拥有丰富的类库,可能C语言100行代码实现的功能,Python用10行就能解决。互联网时代讲究快速迭代,所以开发效率非常重要,如前所述,现在CPU等硬件能力越来越强大,而且有很多针对于Python执行速度方面的优化。
Python的种类:
- Cpython
Python的官方版本,使用C语言实现,使用最为广泛,CPython实现会将源文件(py文件)转换成字节码文件(pyc文件),然后运行在Python虚拟机上。 - Jyhton
Python的Java实现,Jython会将Python代码动态编译成Java字节码,然后在JVM上运行。 - IronPython
Python的C#实现,IronPython将Python代码编译成C#字节码,然后在CLR上运行。(与Jython类似) - PyPy(特殊)
Python实现的Python,将Python的字节码字节码再编译成机器码。 - RubyPython、Brython ...
以上除PyPy之外,其他的Python的对应关系和执行流程如下:
PyPy,在Python的基础上对Python的字节码进一步处理,从而提升执行速度!
Python环境
安装Python
windows:
1
、下载安装包
https:
/
/
www.python.org
/
downloads
/
2
、安装
默认安装路径:C:\python27
3
、配置环境变量
【右键计算机】
-
-
》【属性】
-
-
》【高级系统设置】
-
-
》【高级】
-
-
》【环境变量】
-
-
》【在第二个内容框中找到 变量名为Path 的一行,双击】
-
-
> 【Python安装目录追加到变值值中,用 ; 分割】
如:原来的值;C:\python27,切记前面有分号
linux:
无需安装,原装Python环境
ps:如果自带
2.6
,请更新至
2.7
更新Python
windows:
卸载重装即可
linux:
Linux的yum依赖自带Python,为防止错误,此处更新其实就是再安装一个Python
查看默认Python版本
python
-
V
1
、安装gcc,用于编译Python源码
yum install gcc
2
、下载源码包,https:
/
/
www.python.org
/
ftp
/
python
/
3
、解压并进入源码文件
4
、编译安装
.
/
configure
make
all
make install
5
、查看版本
/
usr
/
local
/
bin
/
python2.
7
-
V
6
、修改默认Python版本
mv
/
usr
/
bin
/
python
/
usr
/
bin
/
python2.
6
ln
-
s
/
usr
/
local
/
bin
/
python2.
7
/
usr
/
bin
/
python
7
、防止yum执行异常,修改yum使用的Python版本
vi
/
usr
/
bin
/
yum
将头部
#!/usr/bin/python 修改为 #!/usr/bin/python2.6
Python入门
一、解释器
如果想要类似于执行shell脚本一样执行python脚本,例: ./hello.py
,那么就需要在 hello.py 文件的头部指定解释器,如下:
#!/usr/bin/env python
print
"hello,world"
如此一来,执行: ./hello.py
即可。
ps:执行前需给予 hello.py 执行权限,chmod 755 hello.py
二、内容编码
python解释器在加载 .py 文件中的代码时,会对内容进行编码(Python2.X中默认是ascill,Python3.X中默认是UTF-8)
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256,所以,ASCII码最多只能表示 256 个符号。
显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可以代表所有字符和符号的编码,即:Unicode
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多
UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...
所以,python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill),如果Python2.x运行如下代码的话:
报错:ascii码无法表示中文
#!/usr/bin/env python
"你好,世界"
改正:应告诉python解释器,用什么编码来执行源代码,即:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"你好,世界"
Python的转码
如下图,Unicode通过encode过程可以编码为其他内容编码,其他内容编码也可以通过decode解码为Unicode。
例如在CMD里用Python2.x的解释器来运行程序中声明为UTF-8代码的中文会报错,因为CMD中默认为GBK的编码。(当然也可以通过CMD命令行中改编码方式)
按照上图的逻辑要作如下转换:
1 # -*- coding:utf-8 -*- 2 temp="张伯伦"#utf-8 3 temp_unicode=temp.decode(‘utf-8‘)#decode过程需指定源 4 temp_gbk=temp_unicode.encode(‘gbk‘)#encode过程需要指定目的。 5 print(temp_gbk)
再次强调下,在Python3.0中没有这种编码问题了,因在其内部没有Unicode了,自动帮我们转换为需要的格式。
三、注释和缩进
当行注视:# 被注释内容
多行注释:""" 被注释内容 """ (Pycharm中选中多行后按Ctrl +/)
Python代码块中的缩进也是一种语法,同缩进长度类似Java中的{}。
四、执行脚本传入参数
Python有大量的模块,从而使得开发Python程序非常简洁。类库有包括三中:
- Python内部提供的模块
- 业内开源的模块
- 程序员自己开发的模块
Python内部提供一个 sys 的模块,其中的 sys.argv 用来捕获执行执行python脚本时传入的参数
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import
sys
print
sys.argv
五、 pyc 文件
执行Python代码时,如果导入了其他的 .py 文件,那么,执行过程中会自动生成一个与其同名的 .pyc 文件,该文件就是Python解释器编译之后产生的字节码。
ps:代码经过编译可以产生字节码;字节码通过反编译也可以得到代码。
六、while循环
1、基本循环
while
条件:
# 循环体
# 如果条件为真,那么循环体则执行
# 如果条件为假,那么循环体不执行
2、break
break用于退出所有循环
1 while True: 2 print "123" 3 break 4 print "456" 5
3、continue
continue用于退出当前循环,继续下一次循环
while True: print "123" continue print "456"
Python运算符
1、算数运算:
Note:除法运算符/在Python2.x中就相当于是floor division//。
2、比较运算
3、赋值运算
4、逻辑运算
5、成员运算:
Python开发系列【1】:初识Python