大模型算法实战专家—周红伟老师
法国科学院数据算法博士/曾任阿里巴巴人工智能专家/曾任马上消费企业风控负责人
课程背景
随着人工智能技术的快速发展,智能助手(如DeepSeek-R1)在多模态理解、个性化交互、知识推理等领域的应用日益广泛。DeepSeek-R1作为深度求索公司推出的第三代智能助手,凭借其先进的核心技术(如大规模预训练、多模态理解、上下文感知等),在智能客服、内容创作、教育、医疗等领域展现了强大的潜力。
然而,要将DeepSeek-R1的能力充分发挥并应用于实际业务场景,不仅需要深入理解其核心技术原理,还需要掌握本地部署和微调的方法,以满足特定领域或企业的定制化需求。为此,本课程旨在帮助学员系统学习DeepSeek-R1的核心技术原理,并通过实操掌握本地部署和微调的技能,从而提升在实际项目中的应用能力。
课程收益
1. 深刻理解DeepSeek-R1的核心技术原理
- 掌握DeepSeek-R1的架构设计、多模态理解、上下文感知、知识图谱等核心技术。
- 掌握大规模预训练模型(如Transformer)的工作原理及其在DeepSeek-R1中的应用。
2. 掌握DeepSeek-R1的本地部署方法
- 学习如何搭建适合DeepSeek-R1运行的本地环境(包括硬件配置、依赖库安装等)。
- 掌握DeepSeek-R1的本地部署流程,包括模型加载、服务启动和接口调用。
- 掌握如何优化部署性能,以支持高并发和低延迟的应用场景。
3. 学会DeepSeek-R1的微调与定制化
- 掌握如何利用领域数据对DeepSeek-R1进行微调,以提升其在特定任务中的表现。
- 学习微调过程中的关键技术,包括数据预处理、模型训练、参数调优等。
4. 提升实际项目中的应用能力
- 通过实战案例,学习如何将DeepSeek-R1应用于智能客服、内容生成、知识问答等场景。
授课形式
理论讲解+案例实操+代码实战+课堂练习+实战演练+小组研讨+互动答疑
课程时间
2天
课程大纲
第一部分:DeepSeek的API的应用实践
1. 大模型的技术原理
-
- 大语言模型概述
- 大模型的技术发展历程
- 大模型的应用场景
- 大模型的Attention机制原理
- 大模型的核心技术原理:Transformer架构
- LLM技术架构原理
- 模型架构:详细讲解LLM的模型架构
- 大模型的输入处理
- LLM的嵌入层
- LLM的SoftMax层
- LLM的输出层
- LLM训练过程
- 大模型的训练LLM的过程
- 大模型数据标注
- 模型训练
- 模型优化算法
- 大模型的性能评估指标和方法
案例分析:分析LLM在实际应用中的典型案例,语义问答、文本生成,实体词提取等。
2. DeepSeek大模型的Prompt Tuning & Fine Tuning
-
- Prompt Tuning技术原理
- 提示微调的应用框架
- 提示微调的应用方法
- 提示微调与传统训练方法的区别
- 提示微调的应用场景
- 案例实践:提示微调的案例实践
-
- Fine Tuning技术原理
- Fine Tuning原理和适用场景
- Fine Tuning的流程与步骤
- Fine Tuning数据标注
- Fine Tuning模型训练
- Fine Tuning参数优化
- 案例实践:利用Fine Tuning的案例实操,如客户评级分析、评价分类
3. DeepSeek API的使用
-
- DeepSeek API技术开发
- DeepSeek API开发调用的两种方法
- DeepSeek API调用的代码开发
- DeepSeek API动态权限接口开发的配置
- DeepSeek API调用的内容模板化
- API请求与响应
- 案例实操基本请求
- 代码编写:基本的API请求参数设置
- 响应解析:讲解如何解析API响应
- API集成
3.7. 代码集成
3.8 案例实践:应用程序通过API调用的业务应用
4. 实践:微调自己的DeepSeek,实现敏感问题审查
-
- 数据准备
- 数据收集
- 敏感问题定义:敏感问题的定义
- 微调过程
- 配置微调环境:依赖包的配置
- 案例实操:微调的具体操作
- 微调的效果评估:评估微调后的DeepSeek在敏感问题审查中表现
- 数据准备
第二部分:大语言模型LLM的本地部署
1. Hugging Face & Model Scope
-
- Hugging Face平台应用
- Hugging Face平台主要产品
- Model Scope平台介绍:数据集、模型库、模型评估
- 模型选择与下载
- 模型浏览:模型选择:模型使用场景和性能指标
- 案例实操:模型下载,代码示例下载过程
2. 文本信息提取
-
- 信息提取方法和应用场景
- 文本信息提取方法
- 文本提取案例:实体识别、关系抽取
- 网络知识图谱
-
- 文本信息提取实践操作
- 传统文本抽取工具与库
- 大模型的文本抽取方法和案例实操
3. 词模型与词嵌入(Tokenizer)
-
- Tokenizer原理
- 词向量化的技术方法
- Embedding的技术原理
- Tokenizer类型和对比:WordPiece、BPE和SentencePiece
-
- Tokenizer实现
- Tokenizer应用案例
- 词嵌入构建
4. Hugging Face API
-
- Hugging Face API应用
- 功能与用途:模型调用和数据处理
- API调用代码编程
- API调用请求示例
- API调用错误处理
5. DeepSeek-R1-Distill-Qwen-7B应用
-
- DeepSeek-R1-Distill-Qwen-7B模型
- DeepSeek-R1-Distill-Qwen-7B应用场景
- DeepSeek-R1-Distill-Qwen-7B技术细节
- DeepSeek-R1-Distill-Qwen-7B架构与机制
- DeepSeek-R1-Distill-Qwen-7B性能评估
6. 案例实践:基于Hugging Face API快速部署模型
-
- 环境准备
- 环境配置:依赖包配置
- 工具安装
-
- 模型部署
- 部署步骤:详细描述模型部署的步骤,包括模型加载、接口设置、测试验证
- 案例实操:本地部署代码实操,提供实际操作示例,展示如何将模型部署到生产环境,包括常见问题及解决方案。
第三部分 大语言模型LLM的本地微调
1. Full Fine Tuning技术详解
-
- Full Fine Tuning:全微调的适用场景
- 技术原理
- 微调流程
- 数据准备
- 训练过程
- 评估与优化
2. 微调框架PEFT
-
- PEFT框架介绍
- PEFT技术优势
- PEFT实践操作
- PEFT框架使用
- 案例分析:分析PEFT框架在实际应用中的案例
3. Prompt Tuning, P-Tuning, Prefix-Tuning
-
- Prompt Tuning的定义与方法
- Prompt Tuning的实施步骤: 包括Prompt设计框架、优化方法
- P-Tuning概述与原理
- P-Tuning应用案例
-
- Prefix-Tuning概述与原理
- Prefix-Tuning技术细节
4. LoRA微调技术原理和实操
-
- LoRA概述
- LoRA定义与背景
- LoRA技术原理:讲解LoRA的技术原理:低秩矩阵分解、参数高效微调
-
- LoRA实践操作
- 案例实操:通过LoRA微调,包括代码示例、配置步骤
- 效果评估
5. 实践:微调DeepSeek-R1-Distill-Qwen-7B
-
- 数据准备
- 数据收集:数据格式
- 数据处理:数据校准
-
- 微调操作
- 微调配置环境:介绍微调环境的配置、工具和依赖包
- 执行微调:微调DeepSeek-R1的操作步骤,包括训练过程、参数设置、结果验证
- 效果评估:评估微调后的DeepSeek-R1模型,包括测试用例、性能分析
第四部分LangChain、Agent和RAG知识增强检索应用
1. 大语言模型的能力增强
-
- 增强概述
- LLM能力增强的方法
- LangChain实践应用
- LangChain应用场景
- LangChain技术实现
2. LangChain的核心模块
-
- 核心模块介绍
- 模块概述
- 技术实现
-
- LangChain案例实操
- LangChain模块配置
- 应用案例:提供实际案例,LangChain核心模块的应用效果
3. 数据连接封装与记忆封装
-
- 数据连接封装
- 数据连接封装实现方法
- 记忆封装
- 记忆封装技术实现
4. 链架构
-
- 链架构概述
- 链架构定义与结构
- 链架构实践操作
- 构建链:演示如何构建链架构,包括设计步骤、代码示例
- 案例分析
5. 数据处理流
5.1 数据处理流概述
5.2 数据处理流实践操作
5.3 构建数据流
6. Agent与外挂知识库
-
- Agent的应用
- 设计与实现:讲解Agent的设计与实现,包括代码示例、操作步骤
- 外挂知识库RAG应用
- 概述与应用
- 实现方法
7. LangChain与Agent应用实践
-
- 实践任务
- 综合案例:综合案例,展示LangChain与Agent的实际应用
- 解决方案设计
- 结果展示与反馈
- 实践任务
专利和文献:
深度学习国际发明专利
1) 基于深度学习的图像检索方法及装置,专利公开公告号:CN107368614A。专利类型:发明公布。发明人:周红伟;李凯;任伟;李庆;郭奇杰;周杨;刘川郁
2) Simulation model and droplet ejection performance of a thermal-bubble microejector,Hongwei Zhou,A.M.Gué,Sensors and Actuators B: Chemical Volume 145,Issue 1,4 March 2010,Pages 311-319
3)Simulation Bubble Nucleation and Bubble Growth of a Thermal Bubble Microejector,Hongwei Zhou,A.M.Gué,Excerpt from the Proceedings of the COMSOL Conference 2009 Mila
图 深度学习国际发明专利