首页 > 代码库 > pandas数据分析(数据结构)

pandas数据分析(数据结构)

本文主要从以下两个方向对pandas的数据结构进行展开,分别为Series和DataFrame(对应的分别是系列与numpy中的一维数组和二维数组)

1.首先从Series讲起,主要介绍Series的创建。

1) 可以通过一位数组进行创建序列

如:在python3.6中测试

#首先导入两个模块,

import numpy as np

import pandas as pd

#创建第一个序列

array1=np.arange(10)

print (array1)

print(type(array1))

##[0 1 2 3 4 5 6 7 8 9]

##<class ‘numpy.ndarray‘>

s1=pd.Series(array1)

print (s1)

print (type(s1))

 通过以上就可以很方便的创建了一个Series

如下:

####

0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
dtype: int32

#######

其中第一列为Series的索引列,第二列为我们给的一位数组,从0到9的整数。

dtype是Series的数据类型(随后的章节我们会介绍pandas中的数据类型)

2) 我们还可以通过字典的形式进行创建Series

dict1={‘a‘:10,‘b‘:20,‘c‘:30,‘d‘:40,‘e‘:50}

s2=pd.Series(dict1)

print (s2)

####

a 10
b 20
c 30
d 40
e 50
dtype: int64

####

把字典传入Series后,字典的键值对分别变成了Series的索引列和数据列。

pandas数据分析(数据结构)