
资源介绍
(英文版电子书)
通过必知的技术和数学概念,将数据转化为洞察,揭开隐藏在数据中的秘密
核心亮点
学习实用的数据科学知识并结合数据理论,从数据中获取最大洞察
探索部署可落地的机器学习管道的方法,同时减轻数据和模型中的偏差
通过可操作的案例研究,立即将新技能付诸实践
购买纸质版或 Kindle 版图书附赠免费 PDF 电子书
内容简介
《数据科学原理》连接了数学、编程和业务分析,让你能够自信地提出并解决复杂的数据问题,构建有效的机器学习管道。本书将为你提供工具,把抽象概念和原始统计数据转化为可操作的洞察。
从数据清洗和准备开始,你将探索有效的数据挖掘策略和技术,之后逐步构建对数据科学各个部分如何相互配合的整体认知。在整本书中,你将发现统计模型 —— 借助这些模型,即使是最密集或最稀疏的数据集,你也能掌控和处理;同时你还将学习如何创建强大的可视化图表,以传达隐藏在数据中的故事。
本版侧重于实际应用,涵盖了用于自然语言处理(NLP)和视觉任务的高级迁移学习和预训练模型。你将掌握减轻数据和模型中算法偏差的高级技术,以及解决模型漂移和数据漂移的方法。最后,你将探索中级数据治理,包括数据溯源、隐私保护和删除请求处理。
读完这本数据科学书籍,你将掌握计算数学和统计学的基础知识,同时了解现代机器学习以及 GPT、BERT 等大型预训练模型的复杂细节。
你将学到什么
通过实际示例掌握数据科学的基本步骤
利用高级统计学和机器学习,弥合数学与编程之间的差距
运用概率、微积分和模型实现对数据的有效控制
探索具有变革性的现代机器学习,包括大型语言模型
通过有影响力的指标和机器学习运维(MLOps)评估机器学习的成效
创建能够传达可操作洞察的引人入胜的可视化内容
量化并减轻数据和机器学习模型中的偏差
本书适用人群
如果你是一名渴望拓展知识的新手数据科学家,这本书非常适合你。无论你具备基本的数学技能并希望在数据科学领域应用它们,还是擅长编程但缺乏必要的数学基础,你都会发现这本书很有用。熟悉 Python 编程将进一步提升你的学习体验。
目录
数据科学术语
数据类型
数据科学的五个步骤
基础数学
不可能还是不太可能 —— 概率入门
高级概率
可能性有多大?统计学入门
高级统计学
数据沟通
如何判断你的烤面包机是否在学习 —— 机器学习基础
预测不会从树上长出来,还是会?
迁移学习与预训练模型入门
减轻算法偏差并解决模型与数据漂移
人工智能治理
实际应用:解析现实世界的数据科学案例研究