首页 > 代码库 > pandas数据分析(数据结构)
pandas数据分析(数据结构)
本文主要从以下两个方向对pandas的数据结构进行展开,分别为Series和DataFrame(对应的分别是系列与numpy中的一维数组和二维数组)
1.首先从Series讲起,主要介绍Series的创建。
1) 可以通过一位数组进行创建序列
如:在python3.6中测试
#首先导入两个模块,
import numpy as np
import pandas as pd
#创建第一个序列
array1=np.arange(10)
print (array1)
print(type(array1))
##[0 1 2 3 4 5 6 7 8 9]
##<class ‘numpy.ndarray‘>
s1=pd.Series(array1)
print (s1)
print (type(s1))
通过以上就可以很方便的创建了一个Series
如下:
####
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
dtype: int32
#######
其中第一列为Series的索引列,第二列为我们给的一位数组,从0到9的整数。
dtype是Series的数据类型(随后的章节我们会介绍pandas中的数据类型)
2) 我们还可以通过字典的形式进行创建Series
dict1={‘a‘:10,‘b‘:20,‘c‘:30,‘d‘:40,‘e‘:50}
s2=pd.Series(dict1)
print (s2)
####
a 10
b 20
c 30
d 40
e 50
dtype: int64
####
把字典传入Series后,字典的键值对分别变成了Series的索引列和数据列。
pandas数据分析(数据结构)