首页 > 代码库 > Python高级数据处理与可视化(一)
Python高级数据处理与可视化(一)
1. 聚类分析
聚类分析(cluster analysis):以相似性为基础把相似的对象通过静态分类的方法分成不同的组别或更多的子集。特性:基于相似性,有多个聚类中心。
K-Means:「K-均值」算法表示以空间中K个点为中心进行聚类,对最靠近他们的对象归类。
In [47]: from numpy import vstack In [48]: from scipy.cluster.vq import kmeans,vq In [49]: list1 = [88.0,74.0,96.0,85.0] In [50]: list2 = [92.0,99.0,95.0,94.0] In [51]: list3 = [91.0,87.0,99.0,95.0] In [52]: list4 = [78.0,99.0,97.0,81.0] In [53]: list5 = [88.0,78.0,98.0,84.0] In [54]: list6 = [100.0,95.0,100.0,92.0] In [55]: data = http://www.mamicode.com/vstack((list1,list2,list3,list4,list5,list6)) # Stack arrays in sequence vertically (row wise).Take a sequence of arrays and stack them vertically to make a single array. In [61]: centroids,_ = kmeans(data,2) # Performs k-means on a set of observation vectors forming k clusters. In [62]: result,_ = vq(data,centroids) # Assign codes from a code book to observations. In [63]: result Out[63]: array([1, 0, 0, 0, 1, 0])
numpy.vstack: https://docs.scipy.org/doc/numpy/reference/generated/numpy.vstack.html
scipy.cluster.vq.kmeans: https://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.vq.kmeans.html#scipy.cluster.vq.kmeans
scipy.cluster.vq.vq: https://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.vq.vq.html
2. Matplotlib绘图基础
3. Matplotlib图像属性控制
4. Pandas作图
5. 数据存取
6. Python的理工类应用
7. Python的人文社科类应用
Python高级数据处理与可视化(一)
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。