电子书人工智能

在线机器学习：Python 实践指南 (英文版电子书）

¥2.90 已售 0

✓ 自动发货 ✓ 永久有效 ✓ 售后保障

立即购买

资源介绍

电子书格式: pdf 《在线机器学习：Python 实践指南》是一部聚焦在线机器学习（OML）领域的专业著作，由伊娃・巴茨（Eva Bartz）与托马斯・巴茨 - 拜尔施泰因（Thomas Bartz-Beielstein）联合编撰，系统梳理了在线机器学习的理论基础、实践方法与应用场景，为相关领域学习者和从业者提供了全面且实用的指导。全书共分为三个核心部分，结构清晰、逻辑连贯。第一部分深入剖析在线机器学习的理论根基，明确在线机器学习的定义、核心特征，细致对比了其与传统批量机器学习（BML）的差异，提出了二者可比性的关键评判标准 —— 质量、时间与内存需求。书中详细阐释了数据流的特性，包括海量性、高速性、多样性、可变性和易逝性等，同时点明了批量机器学习在处理数据流时面临的内存消耗大、难以应对数据漂移、无法高效适配新增未知数据以及数据可访问性受限等痛点，而在线机器学习通过单实例训练更新模型、实时处理数据的特性，恰好为这些问题提供了有效的解决方案。第二部分聚焦实践应用考量，涵盖在线机器学习在实际部署中的各类关键问题。书中详细介绍了监督学习中的分类与回归算法，包括基准算法（如多数类分类器、惰性分类器）、朴素贝叶斯分类器、基于树的方法（霍夫丁树、极快决策树等）以及支持向量机、被动 - 主动算法等其他分类方法，同时也阐述了在线线性回归、霍夫丁树回归器等回归相关技术。针对数据流中的核心挑战 —— 数据漂移，书中系统讲解了漂移的类型（特征漂移、标签漂移、概念漂移）、检测架构（自适应估计器、变化检测器、集成方法）以及常用检测技术（统计检验、控制图、自适应窗口等），并给出了相应的处理策略。此外，还探讨了模型的初始选择、后续更新、灾难性遗忘的应对，以及缺失数据处理、分类属性处理、异常值检测、不平衡数据处理、高维特征处理等特殊需求，同时强调了模型公平性、可解释性在在线机器学习场景中的重要性。第三部分通过具体的实际应用案例验证理论与方法的有效性。书中呈现了官方统计、钢铁行业热轧工艺等领域的应用实例，展示了在线机器学习在处理大规模数据、实时响应数据变化等方面的优势。例如在热轧工艺中，在线机器学习能够实时适配传感器漂移、材料属性变化等动态情况，有效提升工艺预测精度与产品质量。同时，书中详细介绍了当前主流的开源软件包（如 River、MOA 等），对比了不同软件在算法支持、功能特性等方面的差异，为实践者提供了工具选择参考。此外，书中还包含实验对比与超参数调优相关内容。通过自行车共享需求预测、大规模带漂移数据集预测等实验，量化对比了在线机器学习与批量机器学习在性能、时间消耗、内存占用等方面的表现，揭示了二者的适用场景差异。超参数调优部分则介绍了基于序列参数优化工具箱（SPOT）的自动调优方法，通过实际案例展示了调优对提升模型性能、降低资源消耗的显著作用。全书配套提供了 Jupyter Notebook 形式的补充代码，按章节整理于 GitHub 仓库，方便读者实操练习。无论是机器学习领域的初学者，还是寻求在线学习技术突破的科研人员与工程实践者，都能从书中获取系统的理论知识、实用的技术方法与丰富的应用灵感，助力其在数据流处理、实时决策等相关场景中高效应用在线机器学习技术。Online Machine Learning