首页 > 代码库 > 优达学城机器学习工程师纳米学位项目介绍

优达学城机器学习工程师纳米学位项目介绍

本文由 meelo 原创,请务必以链接形式注明 本文地址,简书同步更新地址

 

一对一的项目辅导是优达学城(udacity)纳米学位的一大亮点。本文将简要介绍优达学城机器学习工程师纳米学位的6个项目。项目覆盖了机器学习的主要领域,包括回归分析、分类、聚类、增强学习及深度学习。

项目 0: 预测泰坦尼克号乘客生还率

这个项目需要你手动地实现一个简单的机器学习模型——决策树。
1912年泰坦尼克号在第一次航行中与冰山碰撞沉没,泰坦尼克号乘客生还数据集记录了之中891个乘客的性别、年龄、社会阶级、配偶数量等数据以及他们是否存活。项目需要你观察每一个特征与乘客存活之间的联系,选择合适的特征与阈值进行分类。

技术分享
图 泰坦尼克号乘客生还人数与社会等级的关系

你将从一个简单的算法开始入手,逐渐增加它的复杂度,直到你能够在给定的数据条件下,以至少80%的准确度预测乘客的生还情况。

决策树每次选择一个特征把数据分割成越来越小的子集。如果分割结果的子集中的数据比之前更同质,预测就会更加准确。计算机来帮助我们做这件事回避手动更彻底,更精确。

项目 1: 预测波士顿房价

这个项目使用决策树来预测波士顿的房价,你需要完成机器学习的整个流程。这包括数据探索、建立模型、参数选择、模型评估。
波士顿房价数据集于1978年美国波士顿地区,总共包含506个样本,特征包括房屋平均房间数、学生与老师的比例、房主净资产超过地区平均水平的比例。
项目探讨了决策树的深度以及样本个数对于模型性能的影响,并采用网格搜索来确定模型的参数。

技术分享

图 决策树深度对训练集分数和交叉验证集分数的影响

项目最后探讨了模型是否能够应用于真实世界中。

项目 2: 构建学生干预系统

随着技术在教学活动中的作用日益增加,越来越多的数据被应用到教学成果的检验和预测中。学生行为记录、成绩、与老师同学的互动记录等数据,都已经开始发挥价值。教育者正寻求新的方法来预测教学成果的成败,以便提前采取有效的干预措施,并确认不同干预手段的效果。

数据的特征
school,sex,age,address,famsize,Pstatus,Medu,Fedu,Mjob,Fjob,reason,guardian,traveltime,studytime,failures,schoolsup,famsup,paid,activities,nursery,higher,internet,romantic,famrel,freetime,goout,Dalc,Walc,health,absences,passed

这个项目根据学生学习情况、课外活动情况、家庭情况预测学生是否能够通过期末考试,是一个分类的问题。项目需要使用3种不同的分类器来处理数据,并衡量不同方法的优缺点。
项目数据的部分变量是类别变量,比如父母的工作为服务业、医疗业等,需要转换成2进制变量。

项目 3: 创建客户细分

在这个项目中,我们将获得一批非结构化的数据,你要了解数据的模式,发现他们适合的自然类别。首先你将学到处理无标签数据的实用方法,然后你将选择一个数据集来实践学到的技能,目标是发现数据集中自有的自然类别。
项目使用的数据是批发客户数据集,数据集包含批发客户在生鲜、牛奶、杂货、清洁纸、冷冻、熟食的消费金额。这个项目是一个聚类的问题。
项目首先使用主成分分析法将数据映射到2维。然后根据Tukey‘s Method for identfying outliers清除异常点。最后使用K均值或者高斯混合模型聚类。项目将使用silhouette分数来选择聚类的个数。
项目讨论了对客户细分之后,可以采取差异化的服务策略。同时应用A/B测试分析差异化的服务策略是否有好的效果。

技术分享

图 对经过PCA降维的数据进行高斯混合模型聚类

项目 4: 训练智能出租车学会驾驶

在不远的将来,智能车将可以在无人驾驶的情况下,从任意地点接送乘客。在这个项目中,你将通过强化学习训练智能车学会自动驾驶。
项目需要你实现Q学习算法,让出租车在当前十字路口的红绿灯、其它汽车的状况和目的地做出最优决策。在不给出具体规则,只有不同状态下决策的得失,Q学习算法会学会遵守红绿灯规则和其它交通规则并在最短的时间内到达目的地。
项目需要你为Q学习算法选择合适的参数。并分析算法是否找到了最优的策略。

技术分享

图 智能出租车的模拟环境

项目 5: 毕业项目

在本项目中,你将充分应用之前学到的知识,使用机器学习算法和技术解决你选择的问题。首先确定你想要解决的问题,探讨可能的解决方案和需要关注的性能指标。然后,通过可视化和数据探索分析,进一步发现解决问题最合适的算法和特征。
项目可以从给定了6个方向(深度学习、机器人运动规划、医疗保健、计算机视觉、教育、投资和贸易)选择一个题目,或者是从kaggle上选择一个竞赛。
不像之前的项目会提供部分代码,只需要你根据提示补全。毕业项目需要你从零开始,根据所学的知识完成这个项目。因此毕业项目所需要花费的时间也会大大增加。

技术分享

图 我选择的项目:基于深度学习的街景数字识别

我分享了300元学费红包给你,快来学Google、亚马逊、Facebook官方的机器学习、数据分析、前端开发课程。在这领取: https://cn.udacity.com/referral-invitation/?referral_recipient_amount_off=300&referral_recipient_coupon_code=75BE8D13

优达学城机器学习工程师纳米学位项目介绍