AI 建模师 素养手冊(4)

从深度神经网络 (Deep Neural Network) 认识隐藏空间(Latent spaces)

By 高焕堂 / AI 建模师俱乐部会长

文章目录

  • 前言
  • 一、隐藏空间(Latent spaces)的特质
  • 二、从<单层 NN 模型>说起 
  • 三、多层的 NN 模型 
  • 四、隐藏空间在 AIGC 领域的角
  • 总结


前言

*** 本文摘自 高焕堂 的下列书籍 ***

*** 以及北京【电子世界杂志】连载专栏 ***

复习:空间对映

        在上一集里,特别强调空间对映(Space mapping)的观念和机 制。现在,请您回忆一下(欧式)空间的观念,并且从下述的范例中, 领会欧式空间机制的妙用之处。

        这个范例是:有一个学校,它有 2 万学生,其使用计算机来管 理门禁,只要听学生说出语音:<芝麻开门>。计算机录下这一小段 声音,去辨认是否为本校同学,而决定是否开门。

        请您想一想,其计算机如何进行这<辨认>过程呢?如果您的 思维是:计算机会去 Database 里读取各人的声音来逐一核对。这 就误解 AI 了。传统上,计算机会去 Database 里读取各人的声音来

逐一核对,花费时间很长,反应速度太慢了。这就不是 AI。

        请记得 AI 的特技就是:鉴往知来、瞬间洞察。当 AI 听到<芝麻开门>声音时,不需要去查询 Database,就能瞬间判断了。这才是 AI。为什么古典的计算机做不到呢?因为古典时代里,人们没有让计算机进行机器学习,也就是它没有<鉴古>。在 AI 时代里,其必备过程是:鉴古(即机器学习),所以它能知来(即瞬间洞察)。

        AI 的关键技术在于:鉴古(机器学习)。先在鉴古(机器学习)阶段,就会收集每一位同学的声音成为<训练数据>(Training data)。让每一位学生说出:<芝麻开门>语音,重复说 5 遍,把它录制成 mp3 音檔。于是,2 万个同学,共录制了 10 万个声音(即音檔)。然后从每一个声音,萃取出 39 个特征值(如声量、音高等)。继续把每一项特征都当做数学欧式空间的一个维度。于是,上述所录制的每一个声音(即音檔)都对映到此欧式空间里的一个<点>。

        所以,这 10 万的声音,就对映到空间里的 10 万个点。当 AI 机器学习完成时,这空间里已含有 10 万点,分别位于空间里的各坐标位置上。于是鉴古阶段完毕了。

        接着,就进入应用阶段,又称:预测阶段。真正把 AI 模型(含这欧式空间),布署于门禁系统上。隔天早上,第 1 位学生来了,当场说出语音:〈芝麻开门〉。AI 立即从这个新录下的声音,萃取出 39 个特征值(如声量、音高等)。并且对映到空间里的一个新的点。此时空间里共有 10 万+1 个点。AI 就开始判断了。

        如果这个新的点与原来 10 万个点的距离都很远,就不开门。反之,如果这新的点,很靠近这 10 万个点中的任何一个,就立即开门。这叫:瞬间洞察。过去 IT 资讯时代的计算机技术中,没有< 鉴古>。如果没有<鉴古>,就非 AI 了。以上复习您对 AI 里欧式空间角色的领会

简介<隐藏空间> 

        凡是 AI 生成模型(如 AIGC 的相关模型,都非常依赖关键性的空间,就是本文将介绍的:隐藏空间(Latent space),又称为:潜藏空间。一般的开发者不必去知道隐藏空间的架构及操作技巧,但建模师必需完全掌握它。隐藏空间的向量,就如同人身染色体里的基因组。

        例如当今 AI 科技领域的大浪潮:AIGC。其中主要的生成式 AI 模型是:GAN、ChatGPT 和 Diffusion。其中,GAN 只要是捕捉样本空间的潜藏机率分配。Diffusion 是训练对隐藏空间(Latent Space)细微变化的灵敏度。清晰领会<隐藏空间>观念和含意,是掌握 Diffusion 的关键要素。

#=============== ============

欢迎加入…

<中国 AI 建模师俱乐部>微信群

新创期间,免入会费

询问:misoo.tw@gmail.com Melody 收

*** *** *** *** *** *** *** *** *** 


一、隐藏空间(Latent spaces)的特质

隐藏空间的特质是:

         隐藏空间可模拟人脑的表示方法(Latent spaces are a good model for brain representations)。          隐藏空间蕴藏直觉潜质(Latent spaces have intuitive properties)。

        例如,许多人常拿西洋棋大师的眼睛观察了无数的下棋,脑海 里沉淀(浓缩)出简单的(日月)精华之道,谓之,而蕴含于隐藏空间 里。需要时,能瞬间还原出招式,进而创造出新招式,谓之。 如下所示:

         隐藏空间相当于金庸小说里武林大侠的境界。唯有高度掌握 才能解释千变万化的招术。如果您对于隐藏空间还感觉很玄秒难 懂,那就可能是没有进入无招境界,对于武林高手过招,只能雾里看花了。

二、从<单层 NN 模型>说起

        在前面各章的范例里,都只有建立单层的神经网络模型(NN Model), 也就是只含有一层权重(Weight)。例如,在上一章里,已经看过的范例:

兹以 NN 图形表示如下:

         这个模型从 X 空间对映到 Z 空间。其含有两层(Layer)神经元:左边的 X 神经元是输入(Input)层,而右边的 Z 神经元,是输出(Output)层。然而 只有一层权重,所以通称为:单层 NN 模型。

        请按下<工作分类>,ML 就会寻找出 W 和 B,如下:

        然后,将 X 空间里的 4 个点(即 4 笔数据),经由 X*W+B=Y 和 Sigmoid(Y)Z 公式,对映到 Z 空间里。例如,将 X=[1, 1, 0]对映到 Z 空间, 其计算过程是:

         这个模型所输出的 Z 值,可以传送给另一个模型。也就是成为另一个 模型的输入值。如下图:

        此时,上一个模型的 Z 值,成为这个新模型的输入值。如下图:

         于是,按下<心情分类>,来要求 ML 寻找另一组 W 和 B 值,以便将 Z 在对应到 ZO 空间里。然后输出其预测值 ZO。如下:

         然后,将 Z 空间里的 4 个点(即 4 笔数据),经由 Z*W+B=Y 和 Sigmoid(Y)=ZO 公式,对映到 ZO 空间里。例如,将 Z=[0.93, 0.07]对映 到 ZO 空间,其计算过程是:

         上述范例是两个单层 NN 模型的接力赛。首先训练第 1 个模型许多回 合,逐步探索 W 和 B 值,一直修正足够好的 W 和 B。此时这个模型已经 训练好,就从 X 空间对映到 Z 空间,来输出 Z 预测值了。

        接下来,就把这个 Z 预测值,拿来做为第 2 个模型的输入值,然后开 始训练这个模型,逐步探索、修正而得到足够好的 W 和 B。此时这个模型 已经训练好,就从 Z 空间对映到 ZO 空间,来输出 ZO 预测值了。

        

两层的 NN 模型

        刚才是把两个单层 NN 模型,分别独立训练,先训练好第 1 个模型的 权重,然后把其输出值传送给第 2 个模型,才开始训练第 2 个模型的权重。 换句话说,第 1 个模型的权重先成长完成,才带动第 2 个模型的权重成长。 在本节里,将把两个单层模型合并成为一个双层 NN 模型。在训练时,每 一回合都会同步修正这两层权重。换句话说,这两层权重是一起逐步成长 的。于是,就将它们合并起来,如下图所示:

 

        这个 NN 模型里包含两层权重,所以称为:两层 NN 模型。兹以 NN 图形表示如下:

 

        只要按下<两层一起学习>按钮,ML 就会寻找出中间层的 W 和 B,同时也寻找出输出层的 WO 和 BO。然后将输入层 X 空间,对映到中间层 Z 空间,再对映到输出层的 ZO 空间。于是得出 Z 和 ZO 预测值,如下: 

        这个中间层,通称为:隐藏(Hidden)层。于是,上图又常表示为:

         兹以 NN 图形表示如下:

        

        有些情况下,隐藏层并不需要使用 Sigmoid()激活函数,如下:

         例如,下图里的范例:

 

         这个 NN 模型里的隐藏层,并没有使用 Sigmoid()激活函数。一样地,只要按下这个<两层一起学习>按钮,ML 就会寻找出隐藏层的权重 WH 和 BH,同时也寻找出输出层的权重 W 和 B。如下:

        然后将输入层 X 空间,对映到隐藏层 H 空间,再对映到输出层的 Z 空间。于是得出 H 和 Z 预测值。例如,将 X=[1, 1, 0]经由两层权重的计算 流程是:

         最后计算出 Z 值为:1。继续将 X=[1, 0, 1]经由两层权重的计算流程是:

        这就是典型的两层 NN 模型了。在训练的过程中,每一回合都会修正 输出层的权重,也会修正隐藏层的权重。所以这两层权重是同步成长的。 

四、多层的 NN 模型

        刚才的范例是两层 NN 模型,它只含有一个隐藏层(Hidden Layer)。有些情境下,常常一个 NN 模型里,需要含有更多个隐藏层,这种模型就通称<多层 NN 模型>,或称为<深度 NN 模型>。

         这个新模型含有三层权重。在训练时,每一回合都会同步修正这三层权 重。换句话说,这三层权重是一起逐步成长的。兹以 NN 图形表示如下:

        一样地,只要按下这个按钮,ML 就会寻找出各隐藏 层的权重(如 WH1 和 BH1),同时也寻找出输出层的权重。如下:

         然后将输入层 X 空间,对映到隐藏层 H1 空间,再对映到隐藏层 H2 空间,再对映到输出层的 Z 空间。例如,将 X=[1, 1, 0]经由三层权重的计 算流程是:

         其中,基于三层权重(即 W&B)来进行 4 个空间之间的对映,从 X 空 间 H1 空间,再对映到 H2 空间,再对映到 Z 空间。首先人们设定 Z 空间 里的目标值,如下图:

        在隐藏层 H1 和 H2 里,仍然使用 X*W+B=Y 公式来表达其对映关系; 而在输出层则使用 X*W+B=Y 和 Sigmoid(Y)=Z 公式来表达其对映关系。 并计算出在 Z 空间里的预测值,如下:

        

 

        此外,在许多情境里,常常需要建立更多个隐藏层,例如著名的 ResNet 模型就多达数十个隐藏层,也是常见的多层深度 NN 模型。而基于这种模型的机器学习,就通称为:深度学习(Deep Learning)。

        其中的隐藏层(Hidden Layer)的观念,位于这隐藏层的空间,就简称为:H 空间(即隐藏空间)。其正式名称是:隐藏空间(Latent Space)。例如,范例:

 这是两层 NN 模型,其中的隐藏层(H 空间),就是:隐藏空间。兹以 NN 图形表示:

        只要按下这个<两层一起学习>按钮,ML 就会寻找出中间层的权重 WH 和 BH,从 X 空间,对映到隐藏层 H 空间。同时也寻找出输出层的权重 W 和 B,继续从 H 空间对映到 Z 空间。

        为什么要特别重视于隐藏空间(即 H 空间)呢? 因为最近几年来,ML 许多光芒都来自隐藏空间的威力。因而基于空间对映的观念,迅速掌握隐藏空间神秘力量,是发挥 ML 魅力的有效途径。

        隐藏空间相当于金庸小说里武林大侠的<无招>境界。唯有高度掌握< 无招>才能解释千变万化的招术。君不见,在ML领域里,AE(AutoEncoder) 和 GAN 新潮技术,都是隐藏空间威力的表现。换句话说,如果您对于隐藏空间还感觉很玄秒难懂,那就可能是没有进入无招境界,对于武林高手过招,只能雾里看花了。 

五、隐藏空间在 AIGC 领域的角色

        综观 AIGC 领域里,最近几个很红的图像模型,例如:DALLE、Imagen 和 Midjourney 等,它们都是基于一种机制:扩散(Diffusion)。并且将其扩散模型转化为隐藏扩散模型(Latent diffusion models),因而获得两个特点: 

         经由模型训练,操作隐藏空间向量,加上随机输入中合成新的数据, 呈现出令人惊奇的创作,推动了 AI 绘画模型进行组合创新。

         经由空间对映,把模型的计算空间从可观察的像素空间,降维对映到 (低维)隐藏空间里。因而大幅降低了计算量和时间,于是大幅提高模型的效率。这项创新的隐藏空间操作模式直接推动了 AIGC 技术的突破性进展。因而,AIGC 绘画之所以能够帮助大众画出各种天马行空的画作。

        兹以 Stable Diffusion 为例,它内含两个隐藏空间:1)训练期间使用的图像表示空间(Image representation space)。2)结合预训练与训练时微调的提示潜在空间(Prompt latent space)。

        然后,基于这些隐藏空间来进行探索、操作及创新组合。例如应用于生成动画时,可以对隐藏空间中的一个点进行采样并逐步改变潜在向量表示。其中每个采样点都被转交给译码器(Decoder)生成组合的帧(Frame)存储在最终动画中。最后,这些高质量的潜在表示帧连续播放出来,就是看起来很连贯的动画了。

        隐藏空间的内容是从可观察空间归纳萃取而得到的精华,相当于阅历丰富的领域专家(Domain Expert)内心所领悟沉淀出来的经验直觉。它具有简单性 和稳定性 ( 不变性 ) ,不同领域的专家可以协同合作 (Collaborative),不同的领域的智慧可以共享的(Shareable)。隐藏空间里的内容(如模型)是可以转移(Transfer)、复用(Reuse)和共享(Share)的。既然模型是可以从一个模型或算法转移(迁移)到另一个模型里,就可以在另一个隐藏空间里运行、迭加、组合成为更具有架构性的智慧仓储了。 

◆◆◆

欢迎继续阅读第 5 集

*** *** *** *** *** ***


 

 

 

 

 

总结

#=============== ============

欢迎加入…

微信群 新创期间,免入会费

询问:misoo.tw@gmail.com Melody 收

*** *** *** *** *** *** *** *** ***

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/42420.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGLM 微调实战

在之前的文章中&#xff0c;我们已经讲过了 ChatGPT 的三个主要流程&#xff1a; SFT&#xff1a;通过 Instruction Tuning 来微调一个监督学习模型。Reward Model&#xff1a;通过排序序列来训练一个打分模型。Reinforcement Learning&#xff1a;通过强化学习来进一步优化模…

【Instruction Tuning】ChatGLM 微调实战(附源码)

在之前的文章中&#xff0c;我们已经讲过了 ChatGPT 的三个主要流程&#xff1a; SFT&#xff1a;通过 Instruction Tuning 来微调一个监督学习模型。Reward Model&#xff1a;通过排序序列来训练一个打分模型。Reinforcement Learning&#xff1a;通过强化学习来进一步优化模…

王者荣耀 业务分析

王者荣耀 业务分析 王者荣耀是一款组队竞技游戏。王者荣耀有三个基本玩家财富字段:金币、钻石、点券。 英雄的获取方式有:限免的英雄可用金币或钻石购买&#xff0c;有一些非限免的可用点券购买&#xff0c;一些英雄可通过特定的游戏活动获得。并结合了游戏奖励机制。 它的主要…

王者荣耀游戏时间计算机制,王者荣耀:荣耀战力计算机制解析,如何提高到金牌乃至国服...

原标题&#xff1a;王者荣耀&#xff1a;荣耀战力计算机制解析&#xff0c;如何提高到金牌乃至国服 每个英雄都对应有一个荣耀战力&#xff0c;战力分越高一定程度上代表着你对该英雄的理解越好&#xff0c;当分数高到一定程度上时&#xff0c;会获得荣耀称号&#xff0c;由低到…

c语言王者荣耀制作,易语言制作王者荣耀刷金币脚本的代码

打开黑夜模拟器&#xff0c;按下F10&#xff0c;王者荣耀进入挑战-魔女回忆&#xff0c;开始即可。 王者荣耀刷金币脚本 此功能需要加载精易模块5.6 .版本 2 .支持库 shellEx .支持库 EThread .支持库 eAPI .程序集 窗口程序集_启动窗口 .程序集变量 热键F10, 整数型 .程序集变…

王者荣耀各服务器位置,盘点王者荣耀各位置国服战力排名,辅助榜表示只有富婆才玩的懂...

原标题&#xff1a;盘点王者荣耀各位置国服战力排名&#xff0c;辅助榜表示只有富婆才玩的懂 七月份也是终于过去了&#xff0c;而国服最新的战力榜也是新鲜出炉&#xff0c;当然小伙伴们可能觉得这些跟自己没什么关系&#xff0c;正所谓内行看门道&#xff0c;外行看热闹。今天…

王者营地登录服务器维护,王者营地怎么查看登录记录

王者营地怎么升级到5级 王者营地怎么升级到5级?具体的升级方法是什么呢?很多小伙伴还不是很了解,那么接下来,就跟随玩游戏网的小编一起继续往下看,感兴趣的小伙伴一定不要错过哦!信誉快速升到5级方法介绍:1、多参与游戏,这个是基础,不然的话信誉积分肯定是无法增加的;…

王者荣耀服务器什么时候维护好19赛季,王者荣耀:S19新赛季开启时间确定,国服战力排名会提前锁定...

S19新赛季的开启时间已经确定&#xff0c;正是之前无意间透露出来的3月31日&#xff0c;正好是周二&#xff0c;符合惯例更新的时间点&#xff0c;但并不是以往大版本更新的周四&#xff0c;为什么会出现这样的情况呢&#xff1f;或许是因为从这一次的苹果的审核比较快吧。 在S…

王者荣耀前端模仿

作品初衷 因为想着要写答辩&#xff0c;网页这东西展现的会更直观一点&#xff0c;刚好也复习一下自己基础我牢固的前端知识&#xff0c;也想着提升一下自己前端网页排版能力和逻辑能力 作品简介 编辑器&#xff1a;sublime 语言&#xff1a;htmlcssjs 代码量&#xff1a;…

鸿蒙os版王者荣耀,王者荣耀鸿蒙版

王者荣耀鸿蒙版下载&#xff0c;快猴网为大家带来的王者荣耀鸿蒙版是为了适配华为的鸿蒙系统而特别设立的版本&#xff0c;玩家可以体验远超一般系统的流畅度&#xff0c;让你的手速能轻松跟上你的意识&#xff0c;享受成为王者荣耀鸿蒙版最强王者的快乐吧! 王者荣耀鸿蒙版游戏…

王者荣耀技术指南

者荣耀技术指南&#xff1a; 本人是在2018年9月和10月都获得国服达摩称号&#xff0c;其实就打了一个月国服达摩&#xff0c;由于9月底正好赛季更新&#xff0c;我月底就打了一把10月份国服达摩了。 先讲一下达摩基本连招&#xff1a; 1闪现a3上墙2破甲3第二段贴近敌人&#xf…

国服最强王者之最良心王者

国服最强王者之最良心王者 何为lol最强王者?想成为最强王者&#xff0c;你必须是所在服务器的前50名&#xff0c;这是绝对实力的体现。并且还会面临着紧随其后的玩家的挑战&#xff0c;若有第51个人挑战”最强王者“成功&#xff0c;则原属于”最强王者“最后一名次的玩家或战…

王者荣耀服务器维护S19,王者荣耀:S19官宣31日更新,国服玩家集体声讨天美:1个月白打了...

前言&#xff1a;就在2020年3月28日深夜&#xff0c;王者荣耀官方官宣了一则重大消息&#xff0c;那就是S19赛季即将在2020年3月31日更新。也就是说今年新赛季的到来真是让人猝不及防。但是新赛季的到来&#xff0c;也意味着众多小伙伴们又有一波福利可以领了。不过几家欢喜几家…

王者荣耀各服务器位置,王者荣耀全国排行功能新上线,位置战力系统介绍[多图]...

王者荣耀全国排行功能新上线。在最近的体验服当中王者荣耀官方又尝试进行了多项改动&#xff0c;在原本的省级和国服最强之间增添了全国排名这一级别的荣耀称号&#xff0c;新添加了根据分路了来判断的位置战力和位置段位系统&#xff0c;同时还改版了国服最强的展示页面。 1.荣…

王者荣耀微信哪个服务器怎么选,王者荣耀:国服战力对比!手Q和微信哪个大区的战力更胜一筹?...

原标题&#xff1a;王者荣耀&#xff1a;国服战力对比&#xff01;手Q和微信哪个大区的战力更胜一筹&#xff1f; 每个玩家都希望自己能够获得国服称号&#xff0c;想要获得的难度却是非常大的&#xff0c;但这也不妨玩家们对国服最高战力的讨论。 在王者荣耀里将国服战力分成了…

如何获取宝宝取名软件注册码

如何获取宝宝取名软件注册码 宝宝的名字不仅要伴随宝宝的一生&#xff0c;还具有改变命运的重大意义。所以现在家长都十分重视给孩子起名&#xff0c;现在很多父母给孩子取名上网搜索、翻阅字典、参考各种资料&#xff0c;取得名字很好听&#xff0c;孩子不一定能用。主要是怕名…

宝宝智能起名,免费起名实现方案,带源码

宝宝智能起名&#xff0c;免费起名实现方案&#xff01;&#xff08;带源码&#xff09; 作为一个coder&#xff0c;没有什么问题是代码解决不了的&#xff0c;哈哈哈&#xff01;调皮一下&#xff01; 一个好的名字可以潜移默化的改变人的一生&#xff0c;很多人从来没有考虑到…

宝宝起名工具类

宝宝起名太麻烦&#xff0c;使用如下工具类选择大于96分的名字 public static void main(String[] args) {Integer pages 50;for (int i 1; i < pages; i) {//楚辞起名String chuCiUrl "https://www.mamahaoyun.com/qiming/xingdeng/nvhai/shulong/chuci/?page&qu…

好听的名字 - 收藏给宝宝起名字用

1、伟诚&#xff1a;伟大;真诚。 2、熙茂&#xff1a;形容盛美。 3、怡悦&#xff1a;喜悦;高兴。 4、鹤轩&#xff1a;鹤&#xff1a;闲云野鹤。 5、博超&#xff1a;博&#xff1a;博大;超&#xff1a;超越。 6、德懋&#xff1a;在德行上勉力。 7、淳雅&#xff1a;淳…

【直播预告】ChatGPT下技术开发的模式创新及应用实践

ChatGPT横空出世&#xff0c;标志着人工智能在自然语言处理和深度学习领域取得了跨越性的发展&#xff0c;开创了人机对话模型新篇章。不仅满足了常规的搜索引擎、问答机器人答复基础问题的功能&#xff0c;而且还具备了编故事、写情诗、敲代码、写作业等创作功能。从大量的语料…