预先的在线课程包括40个小时的工作和超过200个练习. 该预习课程将帮助学生学习R和Python,并重访线性代数的基本概念, 微积分, 和统计数据.
- 数学/统计学更新你对线性代数和统计的记忆.
- 微积分:练习基本的数据计算技巧.
- Conda安装:以初学者友好的设置开启您的Python之旅!
- Python:专为初学编程的人设计.
- R:学习R处理和分析数据.
Unix环境在数据科学领域得到了广泛的应用. 熟悉
为了进行进一步的数据分析,常用工具很重要. 本课程使学生能够透过命令行环境与电脑通讯. 它还
介绍了SQL数据库,这是一种传统的数据库,在计算机上已经得到了广泛的应用
企业设置,以及GitHub,一个程序员常用的文件共享平台
用于版本控制.
本课程向学生介绍使用Python编程语言进行数据分析.
学生学习使用Python中的不同数据结构和最流行的数据
分析和可视化包,如numpy、scipy、p和as、matplotlib和seaborn.
Ultimately, 学生 will use effective Python code 和 packages to solve problems; extract,
transform, load, 和 analyze data to gain insights; 和 communicate the analyses, aided by
适当的可视化. 学生被要求完成一个包含这些的项目
实践,以展示派生的见解为高潮.
本课程旨在全面介绍R程序设计
数据分析语言. 学生将学习如何加载、保存和处理数据
有效地使用R和相关库中的函数,包括那些在tidyverse中的函数
集合. 学生将练习如何从常用统计数据中获得见解
techniques, including hypothesis testing 和 basic statistical modeling; effective 可视化;
以及其他在数据分析中经常使用的技术. 此外,学生将学会
成功地沟通他们的见解,包括使用编织器等工具创建报告.
学生需要完成一个展示R语言数据分析能力的项目.
本课程旨在帮助学生将数据分析和数据科学工作融入
跨行业业务操作的真实环境. 学生将会被介绍
各种业务案例,其中的数据集被探索,以获得洞察力来指导和/或
加强业务操作. 他们还将被要求接受给定的业务案例和
概念化可行的项目方法,明确目标,选定工具和方法,
和预期成果
本课程从理论和实践两个角度向学生介绍有监督机器学习. 学生将学习几个重要的理论基础和数学结构, classical models; design a reproducible 机器学习 pipeline, including selection of an optimal model within a given context; 和 demonstrate the soundness 和 effectiveness of the final model, 特别关注从数据中提取见解的模型的价值. 在整个课程中, 学生将看到线性回归模型和分类模型, 贝叶斯分类器, 和时间序列.
本课程从机器学习I开始,扩展学生的机器学习算法库,以及他们在Python中的基本理论基础和实现. 深入到有监督机器学习, 学生将学习基于树的模型, including Bagging Trees 和 R和om Forest; Gradient Boosting; 和 Support Vector Machines. 进入无监督机器学习, 学生将学习聚类技术, including KMeans 和 Hierarchical approaches; 和 Matrix Factorization, 包括主成分分析和潜在狄利克雷分配. 在整个课程中, 学生在选择时将坚持最佳实践, 调优, 批评他们的模型. 最后, 学生将被要求完成一个机器学习项目, 他们将展示自己的机器学习能力,从数据中提炼出更深刻的见解.
本课程向学生介绍更先进的数据科学实践, 包括可伸缩性和深度学习. 在可伸缩性方面, 学生将获得当代主题的概览,如何时从桌面移动到数据库, 大数据技术和云计算. 在深度学习方面, 学生将学习深度学习模型的基本数学构造, 了解深度学习在哪些方面取得了成功,哪些方面没有取得成功, 以及获得几个重要模型架构的概述. 沿着这条路, 学生将得到例子,以比较他们在整个课程中学到的材料,并体现在工业.
该项目旨在让学生应用主要的数据科学概念, 工具, 以及他们在课程中学到的用真实的商业实体的真实数据集解决商业操作问题的方法. 学生被展示数据集和潜在的问题来解决. 然后要求学生组成项目小组, 制定一份项目建议书,供教师审阅和批准, 执行项目. 当项目完成时, 每个项目团队都需要展示项目发现,并分享从研究中获得的业务见解.