首页 > 代码库 > Python进阶(三十九)-数据可视化の使用matplotlib进行绘图分析数据
??matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。
??它的文档相当完备,并且 Gallery页面 中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。
??而 Matplotlib则比较强:Matlab的语法、python语言、latex的画图质量(还可以使用内嵌的latex引擎绘制的数学公式)。
import matplotlib.pyplot as plt
??通过figsize参数可以指定绘图对象的宽度和高度,单位为英寸;dpi参数指定绘图对象的分辨率,即每英寸多少个像素,缺省值为80。因此本例中所创建的图表窗口的宽度为8*80 = 640像素。
import matplotlib
plt.plot(years, price, ‘b*‘)#,label=$cos(x^2)$)
plt.plot(years, price, ‘r‘)
- label : 给所绘制的曲线一个名字,此名字在图示(legend)中显示。只要在字符串前后添加$符号,matplotlib就会使用其内嵌的latex引擎绘制的数学公式。
- color : 指定曲线的颜色
- linewidth : 指定曲线的宽度
??在IPython中输入 plt.plot? 可以查看格式化字符串的详细配置。
plt.ylabel(housing average price(*2000 yuan))
plt.ylim(0, 15)
plt.title(‘line_regression & gradient decrease‘)
- xlabel : 设置X轴的文字
- ylabel : 设置Y轴的文字
- title : 设置图表的标题
- ylim : 设置Y轴的范围
- legend : 显示图示
??matplotlib所绘制的图的每个组成部分都对应有一个对象,我们可以通过调用这些对象的属性设置方法set_*或者pyplot的属性设置函数setp设置其属性值。例如plot函数返回一个 matplotlib.lines.Line2D 对象的列表,下面的例子显示如何设置Line2D对象的属性:
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(0, 5, 0.1)
line, = plt.plot(x, x*x) # plot返回一个列表,通过line,获取其第一个元素
# 调用Line2D对象的set_*方法设置属性值
# 同时绘制sin和cos两条曲线,lines是一个有两个Line2D对象的列表
lines = plt.plot(x, np.sin(x), x, np.cos(x))
# 调用setp函数同时配置多个Line2D对象的多个属性值
plt.setp(lines, color=r, linewidth=2.0)
plt.getp(lines[0], color) # 返回color属性
plt.getp(lines[1]) # 输出全部属性
alpha = 1.0
animated = False
antialiased or aa = True
axes = Axes(0.125,0.1;0.775x0.8)
- 指定属性名:返回对象的指定属性的值
- 不指定属性名:打印出对象的所有属性和其值
f = plt.gcf()
alpha = 1.0
animated = False
plt.getp(f, axes)
??用plt.getp可以发现AxesSubplot对象有很多属性,例如它的lines属性为此子图所包括的 Line2D 对象列表:
alllines = plt.getp(plt.gca(), lines)
alllines[0] == line # 其中的第一条曲线就是最开始绘制的那条曲线
??Matplotlib 里的常用类的包含关系为 Figure -> Axes -> (Line2D, Text, etc.)一个Figure对象可以包含多个子图(Axes),在matplotlib中用Axes对象表示一个绘图区域,可以理解为子图。
subplot(numRows, numCols, plotNum)
??subplot将整个绘图区域等分为numRows行* numCols列个子区域,然后按照从左到右,从上到下的顺序对每个子区域进行编号,左上的子区域的编号为1。如果numRows,numCols和plotNum这三个数都小于10的话,可以把它们缩写为一个整数,例如subplot(323)和subplot(3,2,3)是相同的。subplot在plotNum指定的区域中创建一个轴对象。如果新创建的轴和之前创建的轴重叠的话,之前的轴将被删除。
import numpy as np
import matplotlib.pyplot as plt
plt.figure(1) # 创建图表1
plt.figure(2) # 创建图表2
ax1 = plt.subplot(211) # 在图表2中创建子图1
ax2 = plt.subplot(212) # 在图表2中创建子图2
x = np.linspace(0, 3, 100)
for i in xrange(5):
plt.figure(1) #? # 选择图表1
plt.plot(x, np.exp(i*x/3))
plt.sca(ax1) #? # 选择图表2的子图1
plt.plot(x, np.sin(i*x))
plt.sca(ax2) # 选择图表2的子图2
plt.plot(x, np.cos(i*x))
- 在程序中直接指定字体。
- 在程序开头修改配置字典rcParams。
- 修改配置文件。
??比较简便的方式是,中文字符串用unicode格式,例如:u”测试中文显示”,代码文件编码使用utf-8 加上 # coding = utf-8 一行。
??matplotlib API包含有三层,Artist层处理所有的高层结构,例如处理图表、文字和曲线等的绘制和布局。通常我们只和Artist打交道,而不需要关心底层的绘制细节。
- 创建Figure对象
- 用Figure对象创建一个或者多个Axes或者Subplot对象
- 调用Axies等对象的方法创建各种简单类型的Artists
import matplotlib.pyplot as plt
X1 = range(0, 50)
# y = x^2 X2 = [0, 1] Y2 = [0, 1] # y = x
Y1 = [num**2 for num in X1]
# Create a `figure‘ instance
Fig = plt.figure(figsize=(8,4))
# Create a `axes‘ instance in the figure
Ax = Fig.add_subplot(111)
# Create a Line2D instance in the axes
Ax.plot(X1, Y1, X2, Y2)
import pylab as pl
import numpy
import matplotlib
折线图 Line plots(关联一组x和y值的直线)
import numpy as np
import pylab as pl
x = [1, 2, 3, 4, 5]# Make an array of x values
y = [1, 4, 9, 16, 25]# Make an array of y values for each x value
pl.plot(x, y)# use pylab to plot x and y
pl.show()# show the plot on the screen
散点图 Scatter plots
??把pl.plot(x, y)改成pl.plot(x, y, ‘o’)即可,下图的蓝色版本
美化 Making things look pretty
线条颜色 Changing the line color
??红色:把pl.plot(x, y, ‘o’)改成pl.plot(x, y, ’or’)
线条样式 Changing the line style
??虚线:plot(x,y, ‘–’)
marker样式 Changing the marker style
??蓝色星型markers:plot(x,y, ’b*’)
图和轴标题以及轴坐标限度 Plot and axis titles and limits
import numpy as np
import pylab as pl
x = [1, 2, 3, 4, 5]# Make an array of x values
y = [1, 4, 9, 16, 25]# Make an array of y values for each x value
pl.plot(x, y)# use pylab to plot x and y
pl.title(’Plot of y vs. x’)# give plot a title
pl.xlabel(’x axis’)# make axis labels
pl.ylabel(’y axis’)
pl.xlim(0.0, 7.0)# set axis limits
pl.ylim(0.0, 30.)
pl.show()# show the plot on the screen
在一个坐标系上绘制多个图 Plotting more than one plot on the same set of axes
import numpy as np
import pylab as pl
x1 = [1, 2, 3, 4, 5]# Make x, y arrays for each graph
y1 = [1, 4, 9, 16, 25]
x2 = [1, 2, 4, 6, 8]
y2 = [2, 4, 8, 12, 16]
pl.plot(x1, y1, ’r’)# use pylab to plot x and y
pl.plot(x2, y2, ’g’)
pl.title(’Plot of y vs. x’)# give plot a title
pl.xlabel(’x axis’)# make axis labels
pl.ylabel(’y axis’)
pl.xlim(0.0, 9.0)# set axis limits
pl.ylim(0.0, 30.)
pl.show()# show the plot on the screen
图例 Figure legends
??pl.legend((plot1, plot2), (’label1, label2’), ‘best’, numpoints=1)
其中第三个参数表示图例放置的位置:’best’‘upper right’, ‘upper left’, ‘center’, ‘lower left’, ‘lower right’.
import numpy as np
import pylab as pl
x1 = [1, 2, 3, 4, 5]# Make x, y arrays for each graph
y1 = [1, 4, 9, 16, 25]
x2 = [1, 2, 4, 6, 8]
y2 = [2, 4, 8, 12, 16]
plot1 = pl.plot(x1, y1, ’r’)# use pylab to plot x and y : Give your plots names
plot2 = pl.plot(x2, y2, ’go’)
pl.title(’Plot of y vs. x’)# give plot a title
pl.xlabel(’x axis’)# make axis labels
pl.ylabel(’y axis’)
pl.xlim(0.0, 9.0)# set axis limits
pl.ylim(0.0, 30.)
pl.legend([plot1, plot2], (’red line’, ’green circles’), ’best’, numpoints=1)# make legend
pl.show()# show the plot on the screen
直方图 Histograms
import numpy as np
import pylab as pl
# make an array of random numbers with a gaussian distribution with
# mean = 5.0
# rms = 3.0
# number of points = 1000
data = np.random.normal(5.0, 3.0, 1000)
# make a histogram of the data array
# make plot labels
??如果不想要黑色轮廓可以改为pl.hist(data, histtype=’stepfilled’)
自定义直方图bin宽度 Setting the width of the histogram bins manually
bins = np.arange(-5., 16., 1.) #浮点数版本的range
pl.hist(data, bins, histtype=’stepfilled’)
绘制文件中的数据Plotting data contained in files
从Ascii文件中读取数据 Reading data from ascii files
# fakedata.txt
0 0
1 1
2 4
3 9
4 16
5 25
6 36
7 49
8 64
9 81
0 0
1 1
2 4
3 9
4 16
5 25
6 36
7 49
8 64
9 81
import numpy as np
import pylab as pl
# Use numpy to load the data contained in the file
# ’fakedata.txt’ into a 2-D array called data
data = http://www.mamicode.com/np.loadtxt(’fakedata.txt’)"hljs-header"># plot the first column as x, and second column as y
pl.plot(data[:,0], data[:,1], ’ro’)
pl.xlim(0.0, 10.)
写入数据到文件 Writing data to a text file
import numpy as np
# Let’s make 2 arrays (x, y) which we will write to a file
# x is an array containing numbers 0 to 10, with intervals of 1
x = np.arange(0.0, 10., 1.)
# y is an array containing the values in x, squared
y = x*x
print ’x = ’, x
print ’y = ’, y
# Now open a file to write the data to
# ’w’ means open for ’writing’
file = open(’testdata.txt’, ’w’)
# loop over each line you want to write to file
for i in range(len(x)):
# make a string for each line you want to write
# ’ ’ means ’tab’
# ’’ means ’newline’
# ’str()’ means you are converting the quantity in brackets to a string type
txt = str(x[i]) + ’ ’ + str(y[i]) + ’ ’
# write the txt to the file
# Close your file
import matplotlib.pyplot as plt
x = arange(1,1000,1)
r = -2
c = 5
y = [5*(a**r) for a in x]
fig = plt.figure()
ax = fig.add_subplot(111)
ax.loglog(x,y,label = ry=12σ21,c=5,σ1=?2)
??想要它正常工作,在matplotlibrc配置文件中需要设置text.markup = tex。
??如果你希望图表中所有的文字(包括坐标轴刻度标记)都是LaTeX,需要在matplotlibrc中设置text.usetex = True。如果你使用LaTeX撰写论文,那么这一点对于使图表和论文中其余部分保持一致是很有用的。
- ax.semilogx(x,y) #x轴为对数坐标轴
- ax.semilogy(x,y) #y轴为对数坐标轴
- ax.loglog(x,y) #双对数坐标轴
利用matplotlib 进行折线图,直方图和饼图的绘制
使用 python Matplotlib 库绘图