首页 > 代码库 > Numpy存字符串

Numpy存字符串

# -*- coding: utf-8 -*-import numpy as npstudent = np.dtype({names:[name, age, weight], formats: [S32, i, f]}, align = True)a = np.array([("Zhang", 32, 65.5), ("Wang", 24, 55.2)], dtype = student)aOut[48]: array([(bZhang, 32,  65.5       ), (bWang, 24,  55.20000076)],      dtype={names:[name,age,weight], formats:[S32,<i4,<f4], offsets:[0,32,36], itemsize:40, aligned:True})

DataFrame

一个Datarame表示一个表格,类似电子表格的数据结构,包含一个经过排序的列表集,它们没一个都可以有不同的类型值(数字,字符串,布尔等等)。Datarame有行和列的索引;它可以被看作是一个Series的字典(每个Series共享一个索引)。与其它你以前使用过的(如Rdata.frame )类似Datarame的结构相比,在DataFrame里的面向行和面向列的操作大致是对称的。在底层,数据是作为一个或多个二维数组存储的,而不是列表,字典,或其它一维的数组集合。

因为DataFrame在内部把数据存储为一个二维数组的格式,因此你可以采用分层索引以表格格式来表示高维的数据。分层索引是pandas中许多更先进的数据处理功能的关键因素。

构建DataFrame

技术分享

字典或NumPy数组

最常用的一个是用一个相等长度列表的字典或NumPy数组:

import pandas as pd

data = http://www.mamicode.com/{‘state‘: [‘Ohio‘, ‘Ohio‘, ‘Ohio‘, ‘Nevada‘, ‘Nevada‘],>
frame[‘next‘] = 0 # 增加一列next,默认值为0

frame.to_csv("C:\\mytest.csv")


 

参考:http://blog.csdn.net/pipisorry/article/details/18010307

Numpy存字符串