
资源介绍
将你的机器学习软件从原型转变为成熟的软件系统
通过学习现代软件产品的基础设施、算法和伦理考量基础,高效地将初始设计转化为大型系统。
核心特点
学习如何将机器学习软件提升至专业水平
在运行时确保机器学习管道的质量
将知识应用于自然语言、编程语言和图像领域
内容简介
如今,创建机器学习管道或基于该管道开发软件系统的工作原型虽简单直接,但将其转化为专业软件系统的过程仍任重道远。本书将帮助你掌握各种最佳实践和实用方法,助力软件工程师将原型管道转变为完整的软件产品。
本书开篇介绍了以机器学习为核心的专业软件系统的主要概念。随着学习的深入,你将探索传统非机器学习软件与机器学习软件之间的差异。初始的最佳实践将指导你确定产品所需的软件类型。随后,你将深入研究算法,包括算法的选择、开发和测试,之后通过定义识别合适数据源并确保其质量的最佳实践,探索机器学习系统基础设施的复杂性。
在本书的最后部分,你将探讨大规模机器学习系统最具挑战性的方面 —— 伦理问题。通过探索和定义评估伦理风险的最佳实践及缓解策略,你将以大规模机器学习软件为落脚点,完成本书的学习。
你将学到什么
确定最适合自身需求的机器学习软件
处理可扩展的机器学习管道
将管道从原型扩展为成熟的软件
为产品选择合适的数据源和处理方法
区分原始数据与复杂处理,了解它们的优势
追踪并缓解机器学习软件中的重要伦理风险
进行机器学习系统的测试与验证
本书适用人群
如果你是机器学习工程师,本书将帮助你设计更稳健的软件,并理解需要解决哪些扩展挑战及背后的原因。软件工程师将从最佳实践中获益,这些实践能使产品更稳健、可靠且具创新性。决策者也能从本书中找到大量有用信息,包括如何识别设计良好的机器学习软件产品的指导。
目录
机器学习与传统软件的对比
机器学习软件系统的要素
软件系统中的数据 —— 文本、图像、代码、特征
数据获取、数据质量与噪声
数据属性的量化与改进
机器学习系统中的数据类型
数值和图像数据的特征工程
自然语言数据的特征工程
机器学习系统的类型 —— 基于特征和基于原始数据(深度学习)
经典机器学习系统和神经网络的训练与评估
高级算法的训练与评估 —— 深度学习、自编码器、GPT-3
机器学习管道(MLOps)的设计及其测试
大规模、稳健的机器学习软件的设计与实现 —— 综合案例
数据获取与管理中的伦理问题