首页 > 代码库 > pandas学习
pandas学习
1.读入数据
#-*- coding:utf-8 -*- import numpy as np import pandas as pd df_data = pd.read_csv(‘filename‘,sep=‘\t‘,header=False,names=[‘distance‘,‘pid‘,‘time‘,‘fee‘]) #http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html
2.ix
df_data.ix[df_data[‘carpool‘]==1,‘discount‘] = 1-df_data[‘discount_fee‘]/df_data[‘total_fee‘]
df_sofa[‘start_gird‘] = df_sofa[[‘start_lat‘,‘start_lng‘]].apply(lambda x:get_HexCellKey(x[0],x[1]),axis=1)
3.DataFrame
time_split = pd.DataFrame((x.split(‘ ‘) for x in data.bubble_time),index=data.index,columns=[‘day‘,‘h‘])
4.cut
bins_p = [0, 30, 40, 60, 80, 400] group_names_p = [‘10‘, ‘30‘, ‘40‘, ‘60‘, ‘80‘] data[‘price‘] = pd.cut(data[‘total_fee‘], bins_p, labels=group_names_p)
5.sort_values
data=http://www.mamicode.com/data.sort_values(by=[‘pid‘,‘time‘],ascending=True)
pandas学习
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。