浙大 DeepSeek 线上课学习笔记

目录

DeepSeek:回望AI三大主义与加强通识教育

从达特茅斯启航的人工智能三大主义

人工智能三剑客之一:符号主义人工智能的逻辑推理

人工智能三剑客之二:连接主义人工智能的数据驱动

人工智能三剑客之三:行为主义人工智能的百折不挠

从ChatGPT到DeepSeek

ChatGPT

SORA

The bitter lession in AI

DeepSeek

Chatting or Acting?——DeepSeek的突破边界与“浙大先生”的未来图景

DeepSeek简介

DeepSeek模型结构创新

DeepSeel训练方法创新

LLM or Agent

有了大模型LLM,为什么还需要Agent?

大模型垂域优化的几大手段

智能体开发

DeepSeek智能时代的全面到来和人机协作的新常态

智能演变

人机协作

DeepSeek模型优势:算力、成本

算力(computing power)

核心技术


tips

观看方式:

        视频号:浙江大学AI教育教学研究中心(直播 每周一19:30)

        b站:浙江大学AI教研中心(回放)

观后感:深入浅出,底蕴深厚


DeepSeek:回望AI三大主义与加强通识教育

从达特茅斯启航的人工智能三大主义

1. 1955年8月,基本猜想:学习的所有特点以及大多数智能,原则上都可以被精确描述出来,从而用一台机器来模拟。

What I cannot create,I cannot understand. 不可造也,未能知也。

2. 1956年6月—8月,达特茅斯会议的七大议题:自动计算机、使用语言对计算机进行编程、神经网络、计算复杂度、智能算法的自我改进、智能算法的抽象能力、智能算法的随机性和创造力。

3. 达特茅斯会议号角的吹响,宣布着人工智能登上了历史舞台。

人工智能三剑客之一:符号主义人工智能的逻辑推理

1. 人工智能的三大主义:以符号主义为核心的逻辑推理,以连接主义为核心的数据驱动、以行为主义为核心的强化学习。

2. 人工智能的逻辑推理:正确的知识+正确的推理=>正确的结果

The limits of my language are the limits of my mind. All I know is what I have words for. 语言的边界就是思想的边界。

3. 常用到的两种推理方法:演绎推理、归纳推理。

(1)演绎推理

定义:人们以一定反应客观规律的理论认识为依据,从服从该事物的已知部分,推理得到事物的未知部分的思维方法。

例子:哲学圣贤亚里士多德经典的苏格拉底三段论就是一个非常有名的演绎推理。

(2)归纳推理

定义:人们以一系列经验事物或知识素材为依据,寻找出其服从的基本规律或共同规律,并假设同类事物中的其他事物也服从这些规律。

例子:这里的天鹅都是白色的,那里的天鹅都是白色的,天鹅是白色的。

4. 知识工程

围绕某一特定领域的应用,将人类专家知识转化为结构化知识,存储进数据库,从而支持该领域应用,构建“知识水晶球”,这就是知识工程(knowledge engineering)和专家系统(expert system)。

世界上第一个专家系统Dendral:1965年,图灵奖获得者、斯坦福大学计算机科学家费根鲍姆和化学家勒德贝格合作,结合化学领域的专门知识,研制了世界上第一个专家系统Dendral,进行分子结构分析。

6. 专家系统的缺陷:缺乏人类常识、知识不完备

例子一:大前提不完备,并非所有的鸟都会飞

例子二:缺乏人类常识

麦卡锡批评当时盛行的专家系统因为缺乏常识而给出令人一头雾水的解决方案。在向专家系统询问有关如何治疗肠道中存在霍乱弧菌的方案时,专家系统开出了服用两周四环素的处方。虽然这很可能会杀死所有的细菌,但到那时病人已经死了。

人工智能三剑客之二:连接主义人工智能的数据驱动

1. 深度神经网络:层层递进,逐层抽象。

深度学习的基本动机在于通过“端到端学习(end-to-end learning)”这一机制来构建多层神经网络,已学习隐含在数据内部的关系,从而使学习所得特征具有更强的表达能力。

像素点空间 ---神经网络非线性映射---> 语义空间

2. CPU与GPU

CPU就好比是一位脑力劳动者/领导。可以应对各种复杂的逻辑运算、有序任务。使计算机的整体运行井井有条。像操作系统怎么运行、程序怎么调度,都需要CPU的管理。

GPU更像是一个体力劳动者/工人。拥有大量的计算核心,能同时处理大量简单又重复的计算任务。在处理图形效果、大规模数据并行计算这些方面,GPU表现出的效率比CPU高太多了。

3. 神经元的工作机制:加权累加、阈值输出。

1943年,神经学家沃伦和逻辑学家沃尔特·皮兹合作提出了以他们名字命名的“MCP神经元”模型:在科学史上第一次,我们知道了我们是怎么知道的。

4. 概率为王下的黑箱效应

面对神经网络如炼金术一样的“黑箱效应”,不得不感叹复杂深度模型“我亦无他,唯手熟尔”,与知其然且知其所以然相去甚远。

5. 数据驱动下的滑铁卢

由于训练样本有限、不全面(样本数据:隐藏坦克的阴天森林、无坦克的晴天森林),神经网络只学会了区分阴天和晴天,而不是区分森林是否有坦克。

这提示我们,当人工智能应用到人们的生活时(如:无人驾驶),如果测试场景有限、不全面,那这个系统在未来可能会出现很多低级和严重错误。

人工智能三剑客之三:行为主义人工智能的百折不挠

1. 强化学习

孙子兵法云:“谋定而后动,知止而有得”

意思是:谋划准确周到而后行动,知道在合适的时机收手,会有收获。

强化学习:人工智能算法在不断与其所处环境交互中进行学习,通过“尝试与试错”不断与环境交互,形成序贯决策,直至进入终止状态。反馈牵引,从经验中策略学习。

2. 围棋人机大战:上帝之落子

李世石与AlphaGo第四局中第78步落子被称为“上帝之落子(God' s Touch)”、“神之一手”,这一步在AlphaGo的训练数据中从未见过,触发了AlphaGo的AI盲区,李世石成功扳回一局。

从ChatGPT到DeepSeek

ChatGPT

1. 人工智能的IPHONE时刻

2007年1月9日,乔布斯发布第一代iPhone苹果手机,把iPod、电话、移动互联网设备等进行有机整合(苹果生态圈),推动了移动互联网进入了黄金发展年代。

2023年2月,英伟达创始人兼CEO黄仁勋提出随着ChatGPT为代表的大模型出现,我们已经进入“人工智能的iPhone时刻(iPhone moment of AI) ”,这一观点受到美国《财富》杂志、华尔街时报等媒体的广泛认可并转载。

《自然》杂志列出2023年度十大人物(Nature's10) ,除了按惯例从全球的重大科学事件中评选出十位人物外,还有一位非人类——人工智能(AI)工具ChatGPT也“抢镜”上榜。

2. GPT(Generative Pretraining Transformer)

《Google:Attention is all you need》中提出的Transformer架构: 

Transformer的结构图,拆解开来,主要分为图上4个部分:输入、编码器、解码器、输出。Transformer是一个基于Encoder-Decoder框架的模型。通过Q、K、V矩阵计算实现自注意力机制。

3. GPT训练的三大方式:无监督预训练、有监督微调、反馈强化学习。

4. 数据是燃料,模型是引擎,算力是加速器。

SORA

单词有意义的线性组合->句子;像素点有意义的空间组合->图像;时空子块有意义的时序组合->视频。

2024年春节,OpanAI发布人工智能文生视频大模型,but OpenAI并未单纯将其视为视频模型,而是作为“世界模拟器” 。根据OpenAI提供的有限的技术报告,Sora主要是利用了Diffusion和Transformer模型。Diffusion也叫扩散模型,主要包含加噪和去噪两个过程,它的特点是:更多的注意力在细节,可以生成精美图片;Transformer的关键部件是注意力和编解码器,它的特点是:可以突破序列长度限制,更擅长掌控全局。

Sora基于概率合成的失误视频:

2025年2月25日晚,阿里云宣布开源视频生成大模型万相2.1(Wan),不仅代码、权重全开源,更以86.22%的评测成绩碾压Sora、Luma等国际巨头,中国AI大模型的“封神时刻”到来!

The bitter lession in AI

通过不断扩充模型规模而形成“我亦无他,唯手熟尔”合成能力的思路存在一定天花板,因为“化繁为简,大巧不工”是推动“机器学习”走向“学习机器”的初心。

DeepSeek

DeepSeek打破了大语言模型以大算力为核心的预期天花板,在资源有限的情况下,取得了比肩世界顶级模型的性能。

DeepSeek-V3:混合专家模型、模型参数低秩压缩、工程化努力

DeepSeek-R1:强化学习推理和小模型蒸馏

Chatting or Acting?——DeepSeek的突破边界与“浙大先生”的未来图景

DeepSeek简介

DeepSeek模型结构创新

1. 采用MoE解决路由崩溃难题

    (1)传统的 Top-2 路由策略

    经典的 MoE(Mixture-of-Experts)架构,使用 Top-2 Routing 策略。由 N 个专家(Expert) 组成,路由器(Router)会为每个输入选择 K=2 个专家进行计算。计算结果通过加权求和后输出。

    (2)细粒度专家分割(Fine-grained Expert Segmentation)

    这一阶段对专家进行了更细粒度的划分:将 N 个专家细分为 2N 个更小的专家,从而提供更多的专家选择,提高专家的专业化能力。路由器在更大规模的专家池中选择 K=4 个专家,从而增加多样性和灵活性。

    (3)共享专家隔离(Shared Expert Isolation)

    最终的 DeepSeekMoE 架构,在 (2) 的基础上 引入共享专家:绿色的专家表示 共享专家(Shared Expert),专门处理通用知识。其余专家仍然是 路由专家(Routed Expert),用于特定任务的处理。这里路由器选择 K=3 个专家,其中部分专家可以是共享专家。

    整体意义:

    通过 (2) 细粒度专家分割,使专家的选择更加多样,提高了模型的适应性。

    通过 (3)共享专家隔离,使部分专家专注于通用任务,提升模型的泛化能力,同时减少专家之间的冗余。计算成本保持不变,但模型的效果更强。

    2. MLA多头潜在注意力机制降低成本、提高效率

    序列数据处理模型迭代:HMM,RNN、LSTM、Transformer(Attention)

    Multi-Head Latent Attention(MLA)

    MLA 通过低秩联合压缩技术,显著减少了推理时的键值缓存和训练时的激活内存,同时保持了与标准多头注意力机制相当的性能。MLA 的核心在于对键、值和查询矩阵进行低秩压缩,并通过旋转位置编码引入位置信息,从而在高效推理的同时捕捉输入序列中的复杂特征。

    DeepSeel训练方法创新

    1. 冷启动数据构建

    2. 多阶段强化学习设计

    LLM or Agent

    有了大模型LLM,为什么还需要Agent?

    LLM好比是人的大脑,Agent好比是一个完整的人,能凭借自身的交互执行、任务规划、环境适应、多模态感知及具身能力,弥补LLM的不足,将LLM的知识与能力转化为实际行动,更好地完成各种复杂任务,适应动态变化的环境。

    大模型垂域优化的几大手段

    1. 模型蒸馏:将大模型的能力迁移到小模型上,以适配更低端的算力环境。

    2. 模型微调:使用特定数据集对通用模型进行小规模训练。

    3. RAG:先查资料,再回答问题。

    智能体开发

    青铜:大模型+提示词

    黄金:大模型+提示词+知识库+插件

    王者:大模型+提示词+知识库+插件+工作流

    第一期最后一句话,特别发人深省!

    DeepSeek智能时代的全面到来和人机协作的新常态

    智能演变

    1. 大模型带来大知识

    2. 顿悟时刻 Aha moment

    在训练DeepSeek-R1-Zero中间版本时,模型展现出自我反思能力,能在推理过程中重新评估初始解题思路。

    论文中有个典型例子,在求解数学方程时,模型生成的回答包含“Wait, wait. Wait. That’s an aha moment I can flag here.”和“Let’s reevaluate this step-by-step…”等语句。

    这表明模型不仅在解题,还在有意识地监控自己的思维过程,识别潜在错误,决定回溯重新思考。这属于元推理——对思考的思考,有力证明了强化学习挖掘人工智能深层次智能的巨大潜力。

    3. 思维链 Chain of Thoughts

    4. Grok3 Vs DeepSeek

    5. 推理模型与非推理模型

    人机协作

    1. 人机协作的三种模式

    2. 人工智能时代

    3. 图灵测试

    1950年提出,人工智能领域最具争议与启发性的评估范式,持续75年的思想实验。见证了AI从规则系统到神经网络的范式迁移,见证了人类对自身智能本身的认知突破,见证了智能时代的到来。

    图灵测试起源于计算机科学和密码学的先驱艾伦·麦席森·图灵发表于1950年的一篇论文《计算机器与智能》。该测试的流程是,一名测试者写下自己的问题,随后将问题以纯文本的形式(如计算机屏幕和键盘)发送给另一个房间中的一个人与一台机器。测试者根据他们的回答来判断哪一个是真人,哪一个是机器。所有参与测试的人或机器都会被分开。这个测试旨在探究机器能否模拟出与人类相似或无法区分的智能。

    DeepSeek模型优势:算力、成本

    算力(computing power)

    1. 什么是算力

    对信息数据进行计算,实现目标结果的能力。

    2. 算力的分类

    传统算力:信息计算力

    现代算力:信息计算力、数据存储力、网络运载力

    3. 算力的发展

    原生算力:大脑(可处理复杂逻辑,但不能高速处理简单运算)

    外部算力:草绳、石子  --->  算盘  ---> 计算机

    3. 计算机算力的发展

    大型机时代(1940-1980):数字化未开始,算力需求潜力未发掘;

    PC时代(1980-2000):一个应用只需要一台电脑,算力够;

    云计算时代(2000-2020):应用需求超过一台机器的算力,算力基本够;

    人工智能时代(2020-):算力开始不足,需大量高性能AI加速器。

    4. 人工智能大模型算力估计

    (1)数据量(D) > 15 × 模型参数量(N)

    万亿模型(N)= 10000 × 10^8 = 10^12

    数据量(D)> 15 × 10^12 = 1.5×10^13

    (2)计算次数 C ≈ 6 × D × N

    万亿模型计算次数 C = 6 × 10^12 × 1.5×10^13 = 9×10^25

    (3)计算时间 T = C / 算力 秒

     单H800(25万): 万亿模型的训练时间 T =  9×10^25 / 10^15  =  9×10^10 秒 = 1041700 天

    10000张H800(25亿):9×10^6秒 = 105天(实际会更久,由于并行效率、通信开销、内存带宽限制等,实际算力≠理论算力)

    5. 大模型指导法则Scaling Law:富则火力覆盖,穷则战术穿插

    一般而言,算力越大、数据集越大、参数越多,Test Loss越小,模型效果越好。

    核心技术

    1. DeepSeekMoE

    2. MLA

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27192.html

    如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

    相关文章

    【Python机器学习】1.2. 线性回归理论:一元线性回归、最小化平方误差和公式(SSE)、梯度下降法

    喜欢的话别忘了点赞、收藏加关注哦(关注即可查看全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 1.2.1. 什么是回归分析(Regressive Analysis)? 一些例子 举一些例子吧: 下图是…

    golang介绍,特点,项目结构,基本变量类型与声明介绍(数组,切片,映射),控制流语句介绍(条件,循环,switch case)

    目录 golang 介绍 面向并发 面向组合 特点 项目结构 图示 入口文件 main.go 基本变量类型与声明 介绍 声明变量 常量 字符串(string) 字符串格式化 空接口类型 数组 切片 创建对象 追加元素 复制切片 map(映射) 创建对象 使用 多重赋值 控制流语句…

    《白帽子讲 Web 安全》之移动 Web 安全

    目录 摘要 一、WebView 简介 二、WebView 对外暴露 WebView 对外暴露的接口风险 三、通用型 XSS - Universal XSS 介绍 四、WebView 跨域访问 五、与本地代码交互 js 5.1接口暴露风险: 5.2漏洞利用: 5.3JavaScript 与 Native 代码通信 六、Chr…

    算法日常刷题笔记(3)

    为保持刷题的习惯 计划一天刷3-5题 然后一周总计汇总一下 这是第三篇笔记 笔记时间为2月24日到3月2日 第一天 设计有序流 设计有序流https://leetcode.cn/problems/design-an-ordered-stream/ 有 n 个 (id, value) 对,其中 id 是 1 到 n 之间的一个整数&#xff…

    mysql5.7离线安装及问题解决

    这次主要是讲解mysql5.7离线安装教程和一主一从数据库配置 1、去官网下载自己对应的mysql https://downloads.mysql.com/archives/community/2、查看需要安装mysql服务器的linux的类型 uname -a第二步看一下系统有没有安装mysql rpm -qa|grep -i mysql3、上传安装包 用远程…

    JAVA实战开源项目:安康旅游网站(Vue+SpringBoot) 附源码

    本文项目编号 T 098 ,文末自助获取源码 \color{red}{T098,文末自助获取源码} T098,文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…

    三数之和_算法

    1.题目描述 首先我们分析下这道题目:假设给我们一个数组,让数组某三个不同下标的数相加最终得0,那么我就返回这三个数.但是如果返回的多个数组中的元素相同,那么我们还要删掉其中一个保留一个. 注意:这道题的重点是三个数的下标不能相等并且返回的数组中的元素也不能相等,通过…

    关于Deepseek本地部署硬件环境检查教程

    要在电脑上本地部署DeepSeek,需要关注以下硬件和软件配置: 硬件配置 CPU:至少4核CPU,推荐Intel i5/i7或AMD Ryzen 5/7系列处理器。内存:至少8GB DDR4内存,推荐16GB DDR4内存,对于大型模型建议…

    一周一个Unity小游戏2D反弹球游戏 - 移动的弹板(鼠标版)

    前言 本文将实现控制弹板移动,通过Unity的New Input System,可以支持鼠标移动弹板跟随移动,触控点击跟随移动,并且当弹板移动到边界时,弹板不会移动超过边界之外。 创建移动相关的InputAction 项目模版创建的时候默认会有一个InputAction类型的文件,名字为InputSystem_Ac…

    250302-绿联NAS通过Docker配置SearXNG及适配Open-WebUI的yaml配置

    A. 配置Docker中的代理 绿联NAS简单解决docker无法获取镜像-不用软路由 - 哔哩哔哩 B. 下载官网对应的镜像 群晖NAS用docker搭建SearXNG元搜索引擎_哔哩哔哩_bilibili C. 修改默认省略的参数,只配置Base_URL,删除其它默认的空缺项 searxng-docker/REA…

    C++-第十九章:异常

    目录 第一节:异常有哪些 第二节:异常相关关键字 2-1.抛出异常 2-2.捕获异常 2-3.异常的捕获规则 2-3-1.异常被最近的catch捕获 2-3-2.catch捕获的是异常的拷贝 2-3-3.异常为子类时,可以用父类引用接收 2-4.捕获任意异常 第三节&#xff1…

    Redis详解(实战 + 面试)

    目录 Redis 是单线程的!为什么 Redis-Key(操作redis的key命令) String 扩展字符串操作命令 数字增长命令 字符串范围range命令 设置过期时间命令 批量设置值 string设置对象,但最好使用hash来存储对象 组合命令getset,先get然后在set Hash hash命令: h…

    ‘ts-node‘ 不是内部或外部命令,也不是可运行的程序

    新建一个test.ts文件 let message: string = Hello World; console.log(message);如果没有任何配置的前提下,会报错’ts-node’ 不是内部或外部命令,也不是可运行的程序。 此时需要安装一下ts-node。 npm install

    (十 五)趣学设计模式 之 命令模式!

    目录 一、 啥是命令模式?二、 为什么要用命令模式?三、 策略模式的实现方式四、 命令模式的优缺点五、 命令模式的应用场景六、 总结 🌟我的其他文章也讲解的比较有趣😁,如果喜欢博主的讲解方式,可以多多支…

    基于单片机的智能扫地机器人

    1 电路设计 1.1 电源电路 本电源采用两块LM7805作为稳压电源,一块为控制电路和传感器电路供电,另一块单独为电机供电。分开供电这样做的好处,有利于减小干扰,提高系统稳定性。 LM7805是常用的三端稳压器件,顾名思义0…

    【Redis学习】Redis Docker安装,自定义config文件(包括RDB\AOF setup)以及与Spring Boot项目集成

    【本文内容】 第1章:通过Docker安装Redis,并自定义config文件以及mount data目录。第2章:介绍Redis持久化到磁盘,有4种方式:RDB / AOF / NONE / RDB AOF。第3章:使用Server自带的redis-cli工具连接。第4章…

    【3天快速入门WPF】13-MVVM进阶

    目录 1. 窗体设置2. 字体图标3. 控件模板4. 页面逻辑4.1. 不使用MVVM4.2. MVVM模式实现本篇我们开发一个基于MVVM的登录页面,用来回顾下之前学习的内容 登录页面如下: 窗体取消了默认的标题栏,调整为带阴影的圆角窗体,左侧放一张登录背景图,右边自绘了一个关闭按钮,文本框…

    PHP实现登录和注册(附源码)

    前言 本博客主要讲述利用php环境实现一个简单的前后端结合的用户登录和注册功能。phpstudy是PHP调试环境的集成包,该程序包集成了 ApachePHPMySQLphpMyAdmin 等多个工具,是很好用的调试环境的程序集成包。 目录 前言 1. 准备工作 1.1 工具 1.2 php…

    Redis数据结构-List列表

    1.List列表 列表类型适用于存储多个有序的字符串(这里的有序指的是强调数据排列顺序的重要,不是升序降序的意思),列表中的每个字符串称为元素(element),一个列表最多可以存储2^32-1个元素。在R…

    Redis 实战篇 ——《黑马点评》(下)

    《引言》 (下)篇将记录 Redis 实战篇 最后的一些学习内容,希望大家能够点赞、收藏支持一下 Thanks♪ (・ω・)ノ,谢谢大家。 传送门(上):Redis 实战篇 ——《黑马…