
资源介绍
高级数据操作和可视化方面的潜力(英文版电子书)
本书专为具有一定数据分析经验的中高级 R 和 / 或 Python 用户设计,同时要求读者熟悉 Excel 基础知识。
本书涵盖内容
第 1 章《读取 Excel 电子表格》深入讲解如何将数据从 Excel 导入到 R/Python 中。你将首先学习把第一个 Excel 工作表导入 R,了解 Excel 文件的复杂细节,最后学习对应的 Python 操作方法。
第 2 章《写入 Excel 电子表格》说明在 R/Python 中完成数据分析后,与 Excel 用户有效沟通分析结果的重要性。本章将介绍如何从 R/Python 创建 Excel 工作表以及导出分析结果。
第 3 章《从 R 和 Python 执行 VBA 代码》探讨除了将结果写入 Excel 外,如何在生成的 Excel 工作表中添加 VBA 宏和函数,以进一步增强分析结果最终用户的使用能力。本章将介绍具体实现方法。
第 4 章《进一步自动化 —— 任务调度和邮件发送》介绍 R 中有诸如 RDCOMClient(可与 Outlook 协同工作)和 Blastula 等包,能帮助在 R 中实现分析自动化和报告邮件发送;在 Python 中,smtplib 包可实现相同功能。
第 5 章《格式化 Excel 工作表》讨论相关包如何帮助在 Excel 中创建工作表、表格以及带格式的数据,以及如何使用这些包制作精美的 Excel 报告。
第 6 章《插入 ggplot2/matplotlib 图表》展示如何用 ggplot2 和 matplotlib 创建图形。用户可以使用 ggplot2 主题以及其他工具在 R/Python 中制作精美的图形,并将其插入到 Excel 中。
第 7 章《数据透视表和汇总表》探索如何使用 R 和 Python 操作 Excel 中的数据透视表。学习如何直接从 R/Python 创建和处理数据透视表,实现与 Excel 的无缝交互。
第 8 章《使用 R 和 Python 进行探索性数据分析》介绍如何从 Excel 中提取数据,并使用各种包进行探索性数据分析(EDA),例如 R 中的 {skimr} 包,以及 Python 中的 pandas 和 ppscore 包。
第 9 章《统计分析:线性回归和逻辑回归》教你如何在 R 和 Python 中对 Excel 数据进行简单的统计分析,包括线性回归和逻辑回归。
第 10 章《时间序列分析:统计、图表和预测》说明如何使用 R 中的 forecast 包,以及 Python 中的 kats 和长短期记忆(LSTM)网络进行简单的时间序列分析。
第 11 章《从 Excel 本地或通过 API 调用 R/Python》介绍从 Excel 本地以及通过 API 调用 R 和 Python 的方法。本章还涵盖使用 BERT 和 xlwings 从 Excel 调用本地 R/Python 安装的开源工具,以及开源和商业 API 解决方案。
第 12 章《在 Excel 中使用 R 和 Python 进行数据分析和可视化 —— 案例研究》通过一个案例研究,展示如何通过调用 R 或 Python 在 Excel 中执行数据可视化和机器学习任务。