应用数学家Lek-Heng Lim使用代数、几何和拓扑的工具来回答机器学习中的问题

353d3ba3fd6d72b20c75b8d4fd6c7b45.jpeg

来源:ScienceAI

芝加哥大学应用数学家 Lek-Heng Lim 说:「当它更高级时,任何主题都会变成数学。」

Lek-Heng Lim 渴望一场将纯数学和应用数学重新结合起来的复兴。他指出,这种区别在现代数学中似乎是基本的,实际上是最近才出现的。「纯数学和应用数学之间的分界发生在过去 80 年,」Lim 说。「我会主张回到过去。」

Lim 的研究让我们离这次重聚更近了一步。他使用代数、几何和拓扑等纯数学领域开发的工具研究机器学习和其他应用学科。

Lim 现在是芝加哥大学的教授,但在新加坡长大的他「对数学不太感兴趣,」他说。到了高中,他和一位正在读硕士的物理老师谈起老师的研究。

谈话激起了他对规范理论的兴趣。他说,这门学科「当然是物理学」,「但它非常数学化,将物理量建模为数学对象。」 谈话使他踏上了成为数学家的旅程。

「大部分内容都在我脑海中浮现,但有些条款让我印象深刻,」Lim 说。「当我后来在教育中遇到他们时,感觉就像遇到了一位老朋友。」

2022 年,Lim 获得古根海姆奖(Guggenheim fellowship)。「Lek-Heng 是一位杰出的数学家,」杜克大学统计学教授 Sayan Mukherjee 在推荐古根海姆时写道。「他是他那一代最强大的应用数学家,他致力于数据科学的数值方法、代数和算法的接口。」

23528bbeae370f7b1a54af500a1edc89.jpeg

「我满足于填补我知识中的坑洞,」Lim 说。

将纯数学和应用数学之间的关系描述为不断发展是否公平?

是的。有点不幸的是,我们甚至在讨论纯数学和应用数学之间的关系。这意味着它们是独立的实体。

看看从前的日子。看看高斯、费马或欧拉。甚至晚到冯诺依曼或希尔伯特的人。他们似乎没有做出那种区分。对他们来说,一切都是纯数学,一切都是应用数学。

高斯的工作不仅仅是二次互易和高斯曲率。这也是诸如最小二乘问题和试图找到行星轨迹之类的事情。本质上,他发明了线性回归。这在统计中非常重要。

看看希尔伯特著名的 23 个问题清单。其中一些在应用数学和动力系统方面有着深厚的根基。其中一些植根于纯数学和逻辑。

冯诺依曼对量子力学、数理逻辑、数值分析、博弈论和算子代数感兴趣。

当然,这两个领域现在都非常广泛,任何人都不可能知道所有事情。我认为,在应用数学方面,纯数学家应该知道某些事情。坦率地说,应用数学家通过提高他们对几何、拓扑和代数方面的现代工具的认识,可以获得很多收获。

在 2020 年的一篇论文中,你将深度神经网络与拓扑联系起来。如何?

cef3355923f340f2e303f026a18694cc.jpeg

论文链接:https://dl.acm.org/doi/abs/10.5555/3455716.3455900

过去,计算机发现很难做一些人类可以轻松完成的事情:比如识别咖啡杯不是猫。即使是年幼的孩子也可以相对轻松地做到这一点。但是计算机没有这种能力。

这种情况在 2012 年左右开始发生变化。深度神经网络是关键,这意味着具有多层的神经网络。我猜,发生的事情是这些层意味着什么。这是我的看法。

我和我的博士生 Greg Naitza 一起研究这个问题。他现在在 Facebook 工作。这个想法是:让我们举个例子,所有猫图像的集合和所有不是猫的图像的集合。我们将把它们视为 [拓扑形状或流形]。一个是猫的流形,另一个是非猫的流形。这些将以某种复杂的方式交织在一起。为什么?因为有些东西看起来很像猫,但它们不是猫。美洲狮有时会被误认为是猫。重要的是,两个流形以某种非常复杂的方式交织在一起。

这些如何阐明神经网络?

我们进行了实验以证明这些流形得到了简化。最初,它是两个复杂的形状,错综复杂地交织在一起,但它被简化了。我如何测量形状的这种简化?嗯,有一个工具是计算拓扑的支柱。这使我们能够测量这些物体的形状。

这是什么工具?

这是持久的同源性。

首先,同源性本质上是一种将不同类型的几何对象的不同孔分类到变形的方法。从同源性的角度来看,几何上看起来非常不同的孔看起来是相同的。

如果我只有从流形中采样的点而不是整个流形的知识怎么办?例如,猫的形象:你在电脑屏幕上看到的猫的形象和真正的猫有什么区别?一张图片有像素,所以如果你放大得足够远,你只会看到离散的点。那样的话,我怎么谈同源性呢?

f30e75d0a2727e99577d7efcdb0f55d7.jpeg

林和他的学生 Zehua Lai。他们一起证明了一个长期存在的机器学习猜想是错误的。

在每一点,围绕该点取一个小球。我看到两个球在哪里重叠,三个球在哪里重叠,等等。根据这些数据,它可以为你提供基础流形同源性的估计。当我们只有一个离散点样本时,这允许我们谈论流形的同源性。

我用它来测量流形穿过神经网络层时的形状。最终,我可以证明它可以简化为最简单的形式。

这些结果是否有助于我们了解神经网络中发生的事情?

有一个术语叫做可解释的人工智能。从本质上讲,你的神经网络或机器学习模型将为你提供答案,而你想知道它是如何得出该答案的。

你可以将神经网络视为一种用于简化所研究流形拓扑结构的设备。现在你可以解释它是如何做到这一点的。

是什么让你意识到纯数学工具对你的应用数学研究很有用?

我很好奇人们通常不认为是应用数学的合法主题的事情。因此,我可以看到某些工具的相关性,这些工具对于传统上接受过应用数学培训的人来说并不是直接的。

你使用此类工具的另一个例子是什么?

我的博士生 Zehua Lai 和我证明了一个长期存在的机器学习猜想是错误的。

现代机器学习问题通常涉及用大量数据拟合大量参数。据传,GPT-4 是 ChatGPT 底层引擎的下一代迭代,具有 1 万亿到 100 万亿个参数。现有的计算机无法同时处理所有这些参数。因此,在每一步中,算法都会选择一小部分随机参数(无论计算机可以处理什么),然后只使用这些参数。

b2b94de203b5542e65cdac22906570a0.jpeg

「我很好奇人们通常不认为是应用数学的合法主题的事情,」Lim 说。

选择一个小的随机子集称为抽样。现在的问题是:在算法的后续步骤中,它应该选择我们之前在前面步骤中已经选择的参数,还是应该排除那些?换句话说,它应该对参数进行替换或不替换采样吗?这是我们的算法在涉及到随机化时,总是需要考虑的问题,所以这是一个非常基础和重要的问题。

大约 10 年前,Ben Recht 和 Chris Ré 表明,如果特定不等式的某种类比成立,不放回抽样比放回抽样更好。多年来,人们证明了这种不平等的各种情况 我们表明,一般来说,不等式不成立。

你是怎么做到的?

最终,回答这个问题的方法是使用一种来自代数几何的工具,称为非交换正数集(Noncommutative Positivstellensatz)。有点拗口。这是一个德语词,本质上是指多项式正点的位置。

非交换 Positivstellensatz 是一种叫做 Positivstellensatz 的更复杂的版本。它适用于变量不交换的多项式——其中像 xyx^2 这样的项不能简化为 x^3y。当我们想插入 x 和 y 的矩阵时,这样的非交换多项式非常有用。

对随机算法感兴趣的人可能不会知道 Positivstellensatz,因为它是代数几何中的东西。即使在代数几何中,它也不是标准知识。

你觉得做数学研究最令人满意的是什么?

我满足于满足我的好奇心。有些人想要解决大猜想。他们喜欢建造摩天大楼,可以这么说。

我满足于填补我知识中的坑洼。当它更高级时,任何主题都变得数学化。不管是经济学、社会科学、心理学,我能想到的,归根结底都是数学。

作为一名应用数学家,你可以自由地探索你感兴趣的其他领域。如果你是一个对很多东西都很好奇的人,这会非常令人满意。

参考内容:https://www.quantamagazine.org/an-applied-mathematician-strengthens-ai-with-pure-math-20230301/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

95652268fd2ecbeae5f3399717075cab.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50044.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

推特开发者 学术——【Twitter 开发者账号】使用tweepy4 搜索历史推文

关于推特开发者账号 elevated academic 请看此贴: 推特开发者账号申请权限 或 搜索微信公众号 twitterDeveloper 获得帮助 tweepy4.0的安装请看: https://blog.csdn.net/li123_123_/article/details/120473026 怎么使用tweepy4 来调用twitter api v2接…

通过微信公众号给女朋友推送消息

先看下效果图 准备工作 1、首先去微信公众平台注册成为测试号,点这里 然后再添加一个模板 ![在这里插入图片描述](https://img-blog.csdnimg.cn/875c3ac58c014834b33e268cf239eda2.png 模板里的json字符串示例如下 {{date.DATA}} {{remark.DATA}} 所在城市&a…

观察者模式,从公众号群发说起

每个人应该都订阅了不少微信公众号,那你有没有注意到微信公众号的消息呢?你订阅的公众号号主每发布一篇文章,你都会主动的接收到文章的推送,并不需要你点开每个订阅的公众号一一查看有没有更新,是不是觉得有点意思&…

推特开发者账号 学术【推特开发者文档V2系列3】——tweepy4 解决推文省略号|推文不全

关于推特开发者账号 elevated academic 请看此贴: 推特开发者账号申请权限 或 搜索微信公众号 twitterDeveloper 获得帮助 书接上文: 使用tweepy4 搜索历史推文 在使用推特 v2接口的时候,比如上面的文章,有时候会发现tweepy返…

英语积累知识(一) 2020/1/28 公众号推文翻译

2020/1/28 公众号推文翻译 翻译 This Spring Festival is doomed to be a peculiar one. Without the noise of former festivals, without visiting friends and relatives and dining together with friends, instead,people stay at home to amuse themselves(se…

群推王|如何引爆您的推特流量

推特营销主要吸引力在于其庞大的用户群体。它是最大的社交媒体平台之一,据统计每月有3.3亿活跃用户,为品牌知名度和增长做出了重大贡献。 尽管我们都知道推特营销的重要性,但是在实际运用上大家可能会遇到一些问题,比如您有很多粉…

微信公众号推文发布方法(内涵详细步骤)

今天又朋友专门发信息咨询微信公众号推文怎么发布以及维护方法,在大不分熟悉微信公众号发文流程的同学看来,其实是非常简单的;但是对于没有接触过这一方面的其他同学来讲,也是一件非常苦恼的事情,没有头绪。在经过一番对于朋友的指导,我也把这一流程记录在此,希望能给到…

微信公众号推文发布方法(内含详细步骤)

今天有朋友专门发信息咨询微信公众号推文怎么发布以及维护方法,在大部分熟悉微信公众号发文流程的同学看来,其实是非常简单的;但是对于没有接触过这一方面的其他同学来讲,也是一件非常苦恼的事情,没有头绪。在经过一番…

大模型在金融AIGC领域的前景与应用

随着大模型技术的火爆,人们在思考如何借助 AI 提高编程效率的同时,也在思考 AI 对各行各业都会带来怎样的影响。在 CSDN 与《新程序员》合作举办的「新程序员大会(NPCon)——AIGC 与大模型技术应用论坛」上,来自文因互…

刘强东终于向自己的兄弟下手了!

作者 | 胡巍巍 出品 | CSDN(ID:CSDNnews) 曾经有这么一位老板,把自己的员工当兄弟,称“不会开除任何一位兄弟”。 图源见水印 曾经这位老板,在某年的老员工授勋仪式上,无比仗义地说&#xff…

互联网大佬们的代码水平如何?网友:刘强东95年一个晚上赚5万

作为京东集团大佬,刘强东备受关注。互联网界的大佬,很多都是程序员出身,或者会写代码,就像雷军、马化腾、李彦宏、周鸿祎等,几乎都是编程高手。有人问刘强东的代码水平如何? 关于这个问题,得到了很多网友的…

刘强东的代码水平到底有多强?30年前就已破万!

在人工智能机器学习的领域中,目前最火的莫过于计算机视觉了,这项技术一直广受关注,而其中的目标检测是计算机视觉领域中最常见的问题之一。 从去年的 YOLOv4 发布后,目标检测框架被问的最多的问题就是:“有没有同学复现…

刘强东个人标签太明显,京东没有二号人物

作者 | 赵陈婷 不管个人形象上是利好还是利空,爱公开发声的刘强东的一举一动经常直接影响着京东的股价。不过这个周一,京东赶上了美国劳动节美股休市。 可以说,作为创始人刘强东很大程度上是和他所创办的企业京东划上等号的。这家1998年成立的…

拼多多面试官没想到ThreadLocal我用得这么溜,人直接傻掉

点赞再看,养成习惯,微信搜一搜【敖丙】关注这个互联网苟且偷生的程序员。 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试完整考点、资料以及我的系列文章。 开场白 张三最近天气很热心情不是很好,所以他决定…

大数据面试吹牛草稿V2.0

面试吹牛之前先打个草稿! 本文首发于微信公众号【五分钟学大数据】,公众号上有很多大数据学习方法,学习文档,最全的大数据面试八股文等 各位面试官好! 1. 我叫 xxx,毕业于 xxx,之前在 xxx 公司待了 1 年多&…

抢程序员饭碗?自动写代码的Deep TabNine真如此神奇?

作者 | James Vincent等 编译 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 导读:在过去的一年中,AI 生成书面文字的能力大大提高。通过扫描庞大的文本数据集,机器学习软件可以生成从短篇小说到歌词的各种令人信服的样本…

刘强东的代码水平如何?网友:当年一晚赚5万

作为京东集团大佬,刘强东备受关注。互联网界的大佬,很多都是程序员出身,或者会写代码,就像雷军、马化腾、李彦宏、周鸿祎等,几乎都是编程高手。于是有人问道,刘强东的代码水平如何? 关于这个问题&#xff…

【我惊呆了】Chatgpt比程序员还懂代码

Chatgpt竟然比程序员还懂代码?这个AI让我惊呆了 你有没有遇到过这样的情况:你在写代码的时候,突然发现一个bug,但是你怎么也找不出原因,只能无奈地看着程序崩溃。你想要求助,但是同事都很忙,网上…

刘强东不学编程,今天很可能没有京东......一位码农的发家致富史

公元前216年,16岁的项羽随叔父离开老家宿迁,踏上了西楚霸王之路。2200多年后,“大强子”带着村里人为他凑的500块钱和76个茶叶蛋,离开老家宿迁,来到了中国人民大学社会学院。他跟朋友说:我就是想当官&#…

afl-fuzz.c 源码全分析

afl-fuzz.c 源码全分析 picasso big sb 这是整个 afl 项目的核心,本文根据 clion 调试的执行顺序进行分析。 首先使用 afl-gcc 编译并插桩程序: afl-gcc -g test1.c -o afl-test然后设置 afl-fuzz 的参数,fuzz_in 和 fuzz_out 是新建的&a…