首页 > 代码库 > Pandas学习之常用函数详解
Pandas学习之常用函数详解
本文和大家分享的主要是Pandas库常用函数相关内容,一起来看看吧,希望对大家学习Pandas有所帮助。
1. DataFrame 处理缺失值 pandas.DataFrame.dropna
df2.dropna(axis=0, how=’any’, subset=[u’ToC’], inplace=True)
把在ToC列有缺失值的行去掉
2. 根据某维度计算重复的行 pandas.DataFrame.duplicated
print df.duplicated([’name’]).value_counts() # 如果不指定列,默认会判断所有列"""
输出:
False 11118
True 664
表示有664行是重复的
"""
利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否为重复行,非重复行显示为False,重复行显示为True
3. 去重 pandas.DataFrame.drop_duplicates
df.drop_duplicates([’name’], keep=’last’, inplace=True)"""
keep : {‘first’, ‘last’, False}, default ‘first’
first : Drop duplicates except for the first occurrence.
last : Drop duplicates except for the last occurrence.
False : Drop all duplicates."""
来源:博客园
Pandas学习之常用函数详解
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。