首页 > 代码库 > 最近做的项目的数据处理及可视化小结
最近做的项目的数据处理及可视化小结
使用pandas进行数据处理,主要有对某列数据事先进行提取,提取其中的identifier。用到的操作就是df[‘column‘] = df[‘column‘].apply().
对数据处理完之后用到的就是matplotlib package,这时需要使用 command ipython --pylab打开matplotlib GUI后端,然后就可以使用绘图功能了。
这次处理主要是将数据处理成散点图和热图。
散点图(scatter map)是使用plt.scatter(x,y)来将点描绘到图上。
热图(heat map)是https://gist.github.com/teechap/9c066a9ab054cc322877中介绍的方法,这个主要的优点是不需要了解和使用numpy的数据,直接传入三维的list就可以将绘制出热图。因为暂时对heatmap 代码中绘制的函数还不太熟悉,所以暂时对使用到的函数的初步理解记录在此。
plt.colormesh(x,y,z,cmap).这里面x,y是list,表示的是x,y轴的刻度。z是一个多维的list。e.g:list x中有3个数据,list y中有4个数据,那么list z就是4X3。然后对于cmap是有一些固定的value让你选择的。具体可以去看camp 参数的document.
最近做的项目的数据处理及可视化小结
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。