


资源介绍
型 (中文字幕英文视频教程)
本课程《动手实践AI——基于开源技术从零构建检索增强生成(RAG)模型》是一门面向开发者和AI爱好者的进阶实践课程,旨在通过系统化的技术拆解与实战操作,帮助学员掌握从数据准备到模型部署的全流程技术能力。课程以开源工具链为核心,结合理论讲解与代码实践,覆盖大语言模型(LLM)的本地化运行、数据向量化处理、向量数据库搭建、检索增强生成(RAG)管道构建等关键环节,最终实现一个可运行的RAG系统。
课程共包含25个教学视频(25个.mp4文件),每个视频均配备中文字幕(.srt文件),确保学习者无语言障碍。课程内容分为六大模块,从基础概念到工程实践层层递进,适合具备Python编程基础、对自然语言处理(NLP)有初步了解的学员。通过本课程,学员将掌握如何利用开源生态构建安全可控的AI应用,避免依赖闭源商业服务,同时提升系统安全防护能力。
模块一:RAG模型入门(1章,2个视频)
本模块通过2个视频课程,为学员建立RAG模型的技术认知框架。
视频1:RAG模型基础介绍
从技术原理出发,解析RAG(Retrieval-Augmented Generation)如何通过结合检索与生成能力,解决传统大语言模型在事实准确性、时效性上的局限。课程通过案例对比,说明RAG在金融报告生成、法律文书分析等场景中的优势。
视频2:开源LLM的本地化运行
详细演示如何通过开源框架(如Ollama)在本地环境部署大语言模型,强调数据隐私与系统安全的重要性。课程包含环境配置、模型加载、API调用的完整流程,并指导学员通过容器化技术(如Docker)隔离运行环境,降低系统风险。
模块二:概念与核心技术(2章,12个视频)
本模块深入讲解RAG系统的四大核心技术,通过12个视频构建完整知识体系。
1. 数据收集与语料库构建
视频1:多源数据采集策略
介绍如何从网页、PDF、Word等结构化/非结构化数据源中提取文本,使用开源工具(如Docling)实现自动化处理。课程强调数据清洗的重要性,避免噪声数据影响模型效果。
视频2:语料库生成实践
通过代码示例,演示如何将采集的数据转换为模型可读的格式,并建立索引以提高检索效率。
2. 向量嵌入与数据库管理
视频3:向量嵌入技术解析
从数学原理到工程实现,讲解如何将文本转换为高维向量(Embedding),并对比不同嵌入模型(如BERT、Sentence-Transformers)的适用场景。
视频4:向量数据库搭建
以Postgres为例,指导学员配置支持向量检索的数据库,设计包含文本、向量、文件路径的复合数据表结构。
视频5:数据上传与检索优化
通过Python脚本实现向量、文本、文件名的批量上传,并演示如何通过近似最近邻(ANN)算法加速检索。
3. 查询处理与上下文准备
视频6:查询向量化与相似度匹配
讲解如何将用户查询转换为向量,并通过余弦相似度等指标筛选相关文本片段。
视频7:上下文拼接与提示工程
结合检索结果与LLM生成能力,设计动态提示词(Prompt),确保输出内容既包含事实依据又符合语言习惯。课程提供多种提示模板,并分析其适用场景。
4. 安全防护与工程实践
视频8:系统安全加固
针对数据泄露、模型攻击等风险,介绍输入过滤、输出校验、访问控制等防护措施。例如,通过正则表达式过滤恶意查询,使用哈希算法验证数据完整性。
视频9:开发环境隔离
演示如何使用VS Code的Dev Container功能创建标准化开发环境,避免依赖冲突与配置错误。
模块三:LLM与数据准备(3章,6个视频)
本模块聚焦LLM的本地化开发与数据预处理,通过6个视频完成核心组件搭建。
视频1:开发容器配置
详细说明如何通过Dockerfile定义依赖库、环境变量,实现一键部署开发环境。
视频2:Ollama环境搭建
从安装到API调用,指导学员在本地运行开源LLM,并通过日志监控、资源限制等手段保障系统稳定性。
视频3:模型文件定制
讲解如何修改模型配置文件(如温度参数、最大生成长度),优化输出结果。
视频4:Python集成开发
通过代码示例,演示如何使用Ollama的Python SDK实现模型调用、流式输出等功能。
视频5:语料库自动化生成
结合爬虫框架(如Scrapy)与NLP工具,构建端到端的语料库生成流水线。
视频6:多格式文件解析
使用Docling库解析PDF、Excel等文件,提取结构化数据并统一存储格式。
模块四:数据库与向量检索(4章,5个视频)
本模块通过5个视频深化数据库与检索技术,确保系统高效运行。
视频1:向量嵌入的工程实现
对比不同嵌入模型的性能,选择适合业务场景的方案(如高精度或低延迟)。
视频2:Postgres向量扩展配置
安装pgvector插件,创建支持向量检索的索引,优化查询速度。
视频3:数据库模式设计
设计包含id、text、embedding、metadata的表结构,支持多维度检索。
视频4:批量数据上传
编写Python脚本实现向量与文本的批量插入,处理冲突与重复数据。
视频5:动态内容检索
根据用户查询实时检索相关文本,并通过缓存机制减少数据库压力。
模块五:RAG管道整合(5章,5个视频)
本模块通过5个视频完成系统整合,构建可运行的RAG模型。
视频1:RAG管道架构设计
划分数据层、检索层、生成层,明确各模块交互逻辑。
视频2:上下文准备(上)
实现查询扩展、结果去重等功能,提升检索质量。
视频3:上下文准备(下)
动态调整上下文长度,避免信息过载或缺失。
视频4:高级提示工程
设计多轮对话提示词,支持复杂查询分解与结果聚合。
视频5:系统联调与优化
通过日志分析、性能测试,定位并修复检索延迟、生成错误等问题。
模块六:总结与展望(6章,1个视频)
本模块通过1个视频总结课程成果,并展望技术发展方向。
视频1:下一步学习路径
建议学员探索多模态RAG、分布式向量数据库等进阶主题,同时强调持续监控模型输出、更新数据源的重要性,以维护系统安全性与准确性。
课程特色
开源优先:全程使用Ollama、Postgres、Docling等开源工具,降低技术门槛与成本。
安全导向:从数据采集到模型部署,贯穿安全防护设计,避免隐私泄露与系统攻击。
实战驱动:每个知识点配套代码示例与操作演示,确保学员“学完即用”。
中文支持:视频字幕与文档均为中文,无语言障碍。
本课程适合希望掌握RAG核心技术、构建可控AI系统的开发者,也适合企业技术团队作为内部培训资料。通过系统学习,学员将具备独立开发安全、高效RAG应用的能力,为业务赋能。