
资源介绍
借助这本 Python 代码库与参考手册,自信地开展时间序列分析与预测工作
核心亮点
探索使用统计、机器学习和深度学习算法进行预测和异常检测的技术
学习评估、诊断和优化模型的多种方法
处理包含趋势、多重季节性模式和不规则性的各类复杂数据
内容简介
时间序列数据无处不在,其频率高、容量大,且往往包含噪声、不规则性和多种模式。因此,熟练掌握本书所涵盖的数据准备、分析和预测技术至关重要。
本书介绍了处理时间序列数据的实用技巧,首先从各种来源和格式(无论是私有云存储、关系型数据库、非关系型数据库,还是 InfluxDB 等专门的时间序列数据库)中提取时间序列数据。接下来,你将学习处理缺失数据的策略、应对时区和自定义工作日的方法,以及使用直观的统计方法检测异常,随后还会接触更高级的无监督机器学习模型。书中还将探讨使用 Holt-Winters、SARIMA 和 VAR 等经典统计模型进行预测。这些实用方法将展示如何处理非平稳数据、使用幂变换、ACF 和 PACF 图,以及分解具有多重季节性模式的时间序列数据。之后,你将使用 TensorFlow 和 PyTorch 等工具处理机器学习和深度学习模型。
最后,你将通过书中的实用方法学习如何评估、比较和优化模型等内容。
你将学到什么
理解时间序列数据与其他数据的区别
应用多种缺失数据的插补和插值策略
为单变量和多变量时间序列构建不同模型
使用 TensorFlow、Keras 和 PyTorch 等多种深度学习库
利用 hvPlot 绘制交互式时间序列可视化图表
探索状态空间模型和不可观测成分模型(UCM)
使用统计和机器学习方法检测异常
对具有多重季节性模式的复杂时间序列进行预测
本书适用人群
本书面向数据分析师、业务分析师、数据科学家、数据工程师或 Python 开发人员,他们希望获得用于时间序列分析和预测技术的实用 Python 方法。读者需具备 Python 编程的基础知识。虽然拥有基本的数学和统计学背景会有所帮助,但并非必需。若有使用时间序列数据解决业务问题的经验,也将有助于更好地理解和应用书中的各种方法。
目录
时间序列分析入门
从文件读取时间序列数据
从数据库读取时间序列数据
将时间序列数据保存到文件
将时间序列数据保存到数据库
Python 中的日期和时间处理
处理缺失数据
使用统计方法检测异常值
探索性数据分析与诊断
使用统计方法构建单变量时间序列模型
时间序列的其他统计建模技术
使用监督机器学习进行预测
时间序列预测的深度学习方法
使用无监督机器学习检测异常值
复杂时间序列的高级技术