



资源介绍
视频教程)
本课程共分为 7 个学习阶段,涵盖从基础理论到实战应用,再到职业规划的全流程内容,总时长 100 天。每个阶段都配备了对应的视频课程、中文字幕文件以及实操实验资料,确保学习者能够边学边练,扎实掌握所学知识。经统计,课程视频总数为 26 个,每个视频都聚焦特定学习模块,精准覆盖各阶段核心知识点。
二、各阶段详细内容
(一)第一阶段:数据科学基础(第 1-20 天)
该阶段是数据科学学习的入门基石,旨在帮助学习者搭建扎实的基础框架,为后续深入学习奠定基础。
第 1-5 天:Python 基础:系统讲解 Python 编程语言的核心概念,包括变量定义与使用、循环结构(for 循环、while 循环)的应用、函数的定义、调用及参数传递,以及面向对象编程(OOP)的思想与实践,让学习者能够熟练运用 Python 进行基础编程操作。配套的视频课程与中文字幕文件,可帮助学习者清晰理解每个知识点,同时通过实操练习加深记忆。
第 6-10 天:NumPy 与 Pandas 数据处理:介绍两款在数据科学领域广泛应用的数据处理工具。NumPy 部分重点讲解数组的创建、运算及索引操作,助力学习者高效处理数值型数据;Pandas 部分则围绕 DataFrame 数据结构,详细阐述数据的读取、清洗、筛选、分组与聚合等操作,让学习者掌握数据预处理的核心技能。
第 11-15 天:数据可视化(Matplotlib、Seaborn):数据可视化是呈现数据 insights 的重要手段。此模块讲解 Matplotlib 的基础绘图功能,如折线图、柱状图、散点图等的绘制方法,以及 Seaborn 在 Matplotlib 基础上的进阶应用,包括热力图、箱线图等,帮助学习者通过直观的图表展示数据特征与规律。
第 16-20 天:统计与概率:涵盖统计与概率的核心知识,包括均值、方差等描述性统计量的计算与应用,常见概率分布(如正态分布、二项分布)的特点及适用场景,以及假设检验的基本原理与流程,为后续数据分析与建模提供理论支撑。
此外,本阶段还配备了 “实验 1” 的 HTML 与 PDF 文档,通过实操任务帮助学习者巩固该阶段所学内容,提升动手能力。
(二)第二阶段:数据清洗与探索(第 21-35 天)
真实数据往往存在不完整性、冗余性等问题,该阶段聚焦数据预处理环节,帮助学习者掌握数据清洗与探索的关键技能,为后续建模提供高质量数据。
第 21-25 天:数据清洗:详细讲解数据清洗的核心任务,包括缺失值的识别与处理方法(如均值填充、中位数填充、插值法等)、重复数据的检测与删除,以及异常值的识别(如箱线图法、Z-score 法等)与处理策略,确保数据质量符合分析与建模要求。
第 26-30 天:特征工程:特征工程是提升模型性能的关键步骤。此模块介绍特征编码方法(如独热编码、标签编码等)、特征缩放技术(如标准化、归一化等),以及特征变换手段(如对数变换、多项式变换等),帮助学习者构建更具代表性的特征,为后续建模打下良好基础。
第 31-35 天:探索性数据分析(EDA)与案例研究:通过实际案例,引导学习者运用前期所学知识进行探索性数据分析,包括数据分布分析、变量相关性分析、异常值深度挖掘等,培养学习者从数据中发现问题、提取有价值信息的能力。
本阶段配套 “实验 2” 的 HTML 与 PDF 文档,通过真实数据场景的实操练习,让学习者熟练运用数据清洗与探索技能。
(三)第三阶段:机器学习核心(第 36-55 天)
机器学习是数据科学的核心技术之一,该阶段系统讲解机器学习的基础理论与主流算法,帮助学习者掌握建模与分析的核心能力。
第 36-40 天:机器学习入门、训练集与测试集划分、评估指标:介绍机器学习的基本概念与工作流程,讲解训练集与测试集划分的原则与方法(如留出法、交叉验证法等),以及模型评估的常用指标(如准确率、精确率、召回率、F1 值、均方误差等),让学习者建立对机器学习的整体认知。
第 41-45 天:回归模型:深入讲解主流回归模型,包括线性回归(单变量、多变量)的原理与求解方法、逻辑回归在分类问题中的应用,以及岭回归(Ridge)、套索回归(Lasso)在处理多重共线性问题上的优势与实践,帮助学习者解决连续型变量预测与二分类问题。
第 46-50 天:分类模型:涵盖决策树、随机森林、支持向量机(SVM)、K 近邻(KNN)等经典分类算法,详细阐述各算法的原理、优缺点及适用场景,通过案例演示算法的实现过程,让学习者能够根据实际问题选择合适的分类模型。
第 51-55 天:无监督学习:介绍无监督学习的核心算法,包括 K-Means 聚类算法的原理与实现步骤、主成分分析(PCA)的降维思想与应用,以及聚类算法在客户分群、异常检测等场景中的实际应用,拓展学习者的机器学习技术视野。
“实验 3” 的 HTML 与 PDF 文档为该阶段的实操资料,通过动手建模练习,帮助学习者深化对机器学习算法的理解与应用能力。
(四)第四阶段:机器学习应用与项目(第 56-70 天)
理论知识需结合实际应用才能充分发挥价值,该阶段通过真实案例研究,引导学习者将机器学习技术应用于实际业务场景,提升项目实战能力。
第 56-60 天:案例研究 —— 客户流失预测(分类):以客户流失预测为业务场景,完整演示从数据获取、数据预处理、特征工程,到分类模型构建、模型优化与评估的全流程,帮助学习者掌握分类算法在客户管理领域的应用,为企业制定客户 retention 策略提供数据支持。
第 61-65 天:案例研究 —— 销售预测(时间序列):聚焦时间序列分析技术在销售预测中的应用,讲解时间序列数据的特点、预处理方法(如平稳性检验、差分处理等),以及常用预测模型的构建与优化,帮助学习者解决企业销售预测类业务问题,为库存管理、生产计划制定提供数据驱动决策依据。
第 62-70 天:案例研究 —— 推荐系统(协同过滤):介绍推荐系统的核心思想与协同过滤算法(如基于用户的协同过滤、基于物品的协同过滤),通过实际案例演示推荐系统的构建过程,包括数据处理、相似度计算、推荐结果生成与评估,让学习者掌握推荐系统在电商、内容平台等领域的应用技能。
本阶段的 “实验 4” 提供了与案例配套的实操任务,助力学习者将案例中的方法与思路转化为自身的实战能力。
(五)第五阶段:深度学习基础(第 71-85 天)
随着人工智能技术的发展,深度学习在图像识别、自然语言处理等领域展现出强大能力,该阶段帮助学习者搭建深度学习基础框架,掌握核心技术与工具。
第 71-75 天:神经网络基础:讲解神经网络的基本构成,包括感知器的原理、激活函数的作用,以及前向传播与反向传播的计算过程,让学习者理解神经网络的工作机制,为后续深入学习深度学习模型奠定基础。
第 76-80 天:基于 TensorFlow/Keras 的深度学习:介绍主流深度学习框架 TensorFlow 与 Keras 的使用方法,包括模型的构建(Sequential 模型、函数式 API)、编译(优化器、损失函数、评估指标)与训练过程,帮助学习者熟练运用框架实现深度学习模型。
第 81-85 天:深度学习应用 —— 图像分类(CNN)、文本处理(RNN/LSTM):聚焦深度学习的经典应用场景,讲解卷积神经网络(CNN)在图像分类中的原理与实现,以及循环神经网络(RNN)、长短期记忆网络(LSTM)在文本处理(如文本分类、情感分析)中的应用,让学习者掌握深度学习在特定领域的实用技能。
“实验 5” 为该阶段的实操资料,通过实际项目练习,帮助学习者巩固深度学习知识与框架使用能力。
(六)第六阶段:生成式 AI 与高级应用(第 86-95 天)
生成式 AI 是当前人工智能领域的热门方向,该阶段聚焦生成式 AI 基础与高级应用,同时拓展 AI 在不同行业的实践场景,帮助学习者紧跟技术前沿。
第 86-88 天:大型语言模型(LLM)基础:介绍大型语言模型的核心概念、技术原理,包括模型架构设计、训练过程中的关键技术,以及在自然语言理解、文本生成等场景中的应用,让学习者了解生成式 AI 的核心技术载体。
第 89-91 天:提示工程与微调基础:讲解提示工程的原则与方法,包括如何设计有效的提示词以提升模型输出质量,以及模型微调的基本流程与关键步骤,帮助学习者更好地利用现有模型解决特定业务问题,提升模型适用性。
第 92-93 天:商业 AI 应用(自动化、自然语言处理、聊天机器人):探索 AI 在商业领域的实际应用,包括 AI 驱动的业务流程自动化方案、自然语言处理技术在客户服务、文档分析中的应用,以及聊天机器人的构建与优化,帮助学习者理解 AI 如何为商业场景降本增效。
第 94-95 天:行业 AI 应用(航空、医疗、金融):深入不同行业,分析 AI 技术的应用场景与价值。在航空领域,介绍 AI 在航班调度优化、故障预测中的应用;在医疗领域,讲解 AI 在医学影像分析、疾病风险预测中的实践;在金融领域,阐述 AI 在风控建模、量化分析中的应用,同时强调在金融等敏感领域,需重点关注数据安全与合规性,通过技术手段提升安全防护能力,保障数据与系统安全。
“实验 6” 提供了该阶段的实操任务,涵盖生成式 AI 应用、行业解决方案设计等内容,助力学习者将高级 AI 技术与实际场景结合。
(七)第七阶段:毕业项目与未来发展路径(第 96-100 天)
该阶段是课程的收尾与升华,通过毕业项目综合检验学习成果,同时为学习者规划职业发展路径,助力其顺利进入职场并实现长期发展。
第 96-98 天:毕业项目 —— 端到端流程(数据→机器学习模型→仪表盘 / API):要求学习者独立完成一个完整的数据分析与建模项目,涵盖数据获取与处理、模型构建与优化,以及结果展示(仪表盘开发)或模型部署(API 开发)的全流程,综合运用前 6 个阶段所学知识,提升项目综合实战能力。
第 99 天:数据科学 / AI 岗位作品集与简历制作:指导学习者整理学习过程中的项目成果,构建专业作品集,同时讲解数据科学与 AI 岗位简历的撰写技巧,包括技能展示、项目经历描述、成果量化等,帮助学习者打造具有竞争力的求职材料。
第 100 天:项目展示与 “未来发展方向”:组织学习者进行毕业项目展示,锻炼表达与汇报能力。同时,介绍数据科学与 AI 领域的未来发展方向,包括机器学习运维(MLOps)、高级深度学习技术、细分领域(如生物信息学、自动驾驶相关数据技术)等,为学习者提供长期学习与职业发展的指引。
“实验 7” 为毕业项目提供了实操指导与参考资料,帮助学习者顺利完成项目开发与展示。