
资源介绍
版(英文原版电子书)
本书旨在助力开发者运用前沿的语言模型构建多模态数据分析应用程序。书中会介绍语言模型,以及当下用于在 Python 中调用它们的最重要的库。通过一系列小型项目,展示如何借助语言模型分析文本、表格数据、图像、视频和音频文件。同时,探讨提示工程、微调以及先进的软件框架等主题,让读者能快速构建出高效且划算的、基于语言模型的复杂数据分析应用。
本书适用人群
无论你是对数据分析感兴趣的软件开发人员、数据科学家还是爱好者,只要你希望借助大型语言模型强大的能力来开展各类数据分析工作,这本书都很适合你。书中涵盖了语言模型的所有基础知识,因此即便你此前没有使用过语言模型,也能轻松上手。不过,具备 Python 编程经验会有所帮助,至少要达到初级水平,因为本书会通过 Python 与语言模型进行交互。
本书结构:路线图
本书分为三个部分,共 10 章。第一部分介绍语言模型,并让读者初步了解它们对数据分析的益处:
第 1 章介绍语言模型,并阐释它们在数据分析中的应用方式。
第 2 章引导读者与 ChatGPT 进行交互,展示在 ChatGPT 网页界面中对文本和表格数据的分析过程。
第二部分介绍 OpenAI 的 Python 库,并展示如何直接通过 Python 利用语言模型分析各类数据:
第 3 章介绍 OpenAI 的 Python 库,该库支持用户向语言模型发送请求,并通过多种方式对其行为进行配置。
第 4 章展示如何运用语言模型处理文本数据,例如对文本文档进行分类,或者提取特定信息。
第 5 章演示如何利用语言模型构建自然语言查询界面,将自然语言表述的问题转换为针对数据表或图表的正式查询语句。
第 6 章阐述如何使用多模态语言模型处理图像或视频数据,以完成目标检测、问答以及图像标注等任务。
第 7 章列举了语言模型在音频数据分析中的多种应用场景,比如转录音频录音、搭建语音查询界面,或者将语音输入转换为其他语言等。
第三部分涵盖高级主题,助你优化模型、配置和框架的选择:
第 8 章探讨大型语言模型的不同供应商,简要介绍它们提供的模型以及相应的 Python 库。
第 9 章展示可用于降低处理成本并确保语言模型输出质量的方法,包括优化模型选择、参数设置和微调等方面。
第 10 章讨论了几个软件框架,特别是 LangChain 和 LlamaIndex,它们可用于在大型语言模型基础上构建复杂的应用,且实现成本较低。
建议读者从第 1 章开始阅读,该章介绍了重要的术语和概念。如果你已经通过网页界面使用过语言模型,也可以直接从第 2 章开始。本书其余大部分章节都基于 OpenAI 的 Python 库,因此建议在深入阅读后续章节之前先阅读第 3 章。第 4 至 7 章分别聚焦于不同的数据类型,读者可以按任意顺序阅读。同样,第 8 至 10 章相互独立,你可以根据自己的需求选择阅读顺序。