首页 > 代码库 > pandas介绍及环境部署

pandas介绍及环境部署

pandas介绍

  Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。pandas是python里用于分析结构化数据的工具集,具有数据迁徙功能,可以处理海量数据

  pandas依赖于两个科学计算库,numpy与matplotlib

  numpy:提供高性能矩阵运算和一些数据模型

  matplotlib:提供数据可视化

数据分析环境

Ipython介绍

IPython 是一个交互式的 Python 解释器,而且它更加高效。除了代码补全,代码高亮外,还有很多magic(%)命令。
常用命令:%run test.py(执行py文件)
    %timeit a.dot(a)计算两个矩阵相乘,点乘,内积
    %quickref查看ipython文档
显示内联图片,在命令行输入ipython notebook,ipython会自动启动一个WEB服务,并打开常用浏览器,访问ipython网页页面,运行命令:shift+enter,自动运行并且插入新命令行
它和大多传统工作模式(编辑 -> 编译 -> 运行)不同的是, 它采用的工作模式是:执行 -> 探索 ,而大部分和数据分析相关的代码都含有探索式操作(比如试误法和迭代法),所以 IPython 能大大提高编码效率。 
IPython 发展到现在,它不仅仅只是一个加强版的 Python shell 了, 它集成了 GUI 控制台,这可以让你直接进行绘图操作;它还有一个基于 Web 的交互式笔记本和一个轻量级的快速并行的计算引擎。

Ipython开发环境搭建

  需要安装的库有jupyter(Ipython工具)、numpy、matplotlib、(windows需要额外安装pyreadline,在ipython环境里面有命令行自动完成功能,mac及linux下无需安装)

pip3 install jupyterpip3 install numpypip3 install matplotlibpip3 install pyreadline

  根据以上命令挨个安装即可,安装速度慢可以加上pip国内豆瓣源

Ipython环境测试

以上库都安装完成之后,打开终端,输入ipython检测是否环境搭建完成

技术分享

出现如上图所示,表示ipython环境搭建完成

 

 

 

 

pandas介绍及环境部署