Skip to content

meizeidexzh/data-science

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

62 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

优达数据分析纳米学位项目

p0 湾区单车共享分析

项目要求:作为一名数据分析师,你有能力回答你的公司最重要的问题,并用清晰简洁的可视化展示你的发现。对于这个初始项目,你将扮演一位数据分析师,调查一个原始数据集,并用 Jupyter Notebook 分享你的发现。你将分析由“湾区单车共享”提供的真实数据,找出通勤人员和游客的单车使用模式、行程时间等的不同之处。

p1 检验心理现象

项目要求:在该项目中,你将对实验心理学中的典型现象——斯特鲁普效应展开调查。你将获得对实验的初步认识,根据结果作出假设,并亲自体验该实验任务。然后,你要查看其他执行了相同任务的人的数据,并计算出描述这些结果的一些统计数据。最后,你要根据你的假设解读你的结果。

p2

项目要求:对于这个项目,你需要进行数据分析,并创建一个文档分享你的发现。你可以首先了解数据集,想想它可以用来回答哪些问题。然后,你应该使用 Pandas 和 NumPy 回答你感兴趣的问题,并编写一份报告,分享你的结论。

数据集选择:泰坦尼克号

p3 整理openstreet数据

项目要求:你将在 https://www.openstreetmap.org 中的世界里选择任意区域,然后使用数据加工技术(比如针对有效性、准确率、完整性、一致性和均匀性评估数据质量),为该世界中你关注的那部分区域清理 OpenStreetMap 数据。

整理工具选择: SQL

p4 研究和数据总结(R)

项目要求:在此项目中,你将使用 R 并运用探索性数据分析来探索一个变量或多个变量之间的关系,以及在一个选定的数据集中探索分布、异常值和反常现象。

数据选择:prosper贷款数据

p5 从安然公司邮件中发现欺诈数据

项目要求:在此项目中,你将扮演侦探,运用你的机器学习技能构建一个算法,通过公开的安然财务和邮件数据集,找出有欺诈嫌疑的安然雇员。

p6 数据可视化

项目要求:在此项目中,你将使用一个数据集创建一个数据可视化,用于表明数据的状况或突出它的趋势或模式。你将需要使用 dimple.js 或 d3.js 创建这个可视化。你需要思考数据可视化的理论和实践,如视觉编码、设计原则和有效沟通。

p7 设计A/Btest

项目要求:在本项目中,你所要考虑的是由优达学城运行过的一个真实试验。具体数字已做更改,但是模式并没有改变。你要将试验的想法变成一个完整定义的设计、分析其结果,并提供一个高层次的后续实验。数据分析师通过 A/B 测试决定一个改变是否会引起其他改变。历史数据只会告诉你两个改变之间的相关性,而不是因果性。能够正确地设置和分析 A/B 测试,是数据分析师的必备技能之一。

About

优达数据分析纳米学位作品

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • HTML 96.3%
  • Jupyter Notebook 3.6%
  • Python 0.1%