首页 > 代码库 > 菜鸟的数据挖掘之路(1)

菜鸟的数据挖掘之路(1)

    从书中读到数据科学家应具备:计算机科学,数学,统计学,机器学习,某一领域的专业知识,沟通和演讲的技巧,数据可视化等七项技能。统计学家和机器学习专家在处理问题的方式角度有所不同。统计学家认为模型中的参数必须在显示世界中有意义,而软件工程师主要关注如何将算法植入到产品中,他们不会关注模型参数的意义,只是为了提升模型的预测能力,而不是为了解释这些参数。我认为优秀的数据科学家应该站在双方的角度考虑问题。

    从各个渠道查看数据分析学习路径,看到一个比较好的路径,希望在这里记录下来:  

    1.统计概率基础:数据分析行业分析,数据挖掘经典流程,数据的描述性分析,数据的推断性分析,方差分析,回归分析,多元统计。唯有掌握原理,方能驾驭工具。

    2.数据分析工具学习:广泛程度:STATA>R>Matlab>SPSS>SAS;商业界:SAS>R>Matlab>STATA>SPSS>EXCEL

    3.数据分析建模:常用的数据挖掘算法有:时间序列,Danel Pata,关联规则,神经网络,决策树,遗传算法。常用的数据分析方法有:回归分析法,主成分分析法,典型相关分析,因子分析法,判别分析法,聚类分析法,结构方程,Logistic模型。

    4.以上三部分均为数据分析硬性技术,要想熟能生巧需要经常在学习和工作中运用,不断改善,不断优化模型,将技术与具体业务结合起来。

 

    目前学习计划为:学习数据挖掘算法,概率论与数理统计,Python数据收集,结合数据挖掘算法熟练R语言的使用,同时主要对金融数据进行挖掘。

菜鸟的数据挖掘之路(1)