陶哲轩晒出调教GPT-4聊天记录,点击领取大佬的研究助理!

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【多模态和Transformer】交流群

衡宇 萧箫 发自 凹非寺
转载自:量子位(QbitAI)

鹅妹子嘤,天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT了!

就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用了GPT-4”,后者给他提出了一种可行的解决方法。

2f97c81280e3742423f09506c6d792bc.png

借助GPT-4,他不仅成功地突破了这一难题,还将答案分享在了MathOverflow上:

它给我提供了最终的解题思路,接下来我只需要继续计算就行。

为了给更多数学家分享用GPT-4工作的便利性,陶哲轩还将自己的聊天记录po了出来,里面完整地记载了他和GPT-4的对话。

ccf51ce11a67db976738110d46d826dc.png

可以看见,在这份聊天记录中,他把GPT-4称呼为“专业数学合作者”,而不仅仅是一个普通的数学助手。

这个身份属实不一般了,不知道之后陶哲轩写论文的时候会不会把GPT-4列为共同作者(手动狗头)。

163e4a9e87756516a3ab27651bf4d978.png

不仅如此,戳对话记录底部的“continue this conversation”按钮,还能一键把对话记录导入自己的ChatGPT中,突然闯入人类大师和AI的交谈。

107b1b1f0f599ad41dcf9715e71d5d59.png

陶哲轩解决了什么新问题?

陶哲轩研究的问题,是一个两天前在数学网站MathOverflow上更新的提问。

7bc6bc76d9d806b7b22ed84d3818af17.png

这个名叫“优雅的递归之A301897”问题,具体长这样:

b1aa031dd9123bcd52a7e6b013df7505.png

其中,A301897是一个被整数数列网站OEIS收录的数列:

0a1238a403268ae6b0dfc4bba4f2da47.png

这个数列中有一系列来自长度为n的排列b的数,它们有一个共同点,就是满足Diaconis-Graham不等式且等号成立。

Diaconis-Graham不等式由戴康尼斯(Persi Diaconis)和葛立恒(没错,就是“最大数”之父Ronald Graham)于1977年共同提出,属于概率统计方面的研究。

显然,这一大段提问中不仅夹杂着大量专业数学公式,而且还涉及需要跳转的网页资料

作为数学公认不太好的“数学菜鸡”,GPT-4真的能像一名专业数学家那样快速读懂公式、给出解决问题的专业建议吗?

事实上,相比直接把问题复制粘贴给GPT-4,陶哲轩做了三件事

  • 首先,做一些提示工程,明确GPT-4的“身份”和“目标”。其中身份是“一个擅长给技巧性建议的数学合作专家”,目标是“提供一些建议”而非解决问题。

  • 然后,相比直接把大段公式复制进GPT-4提问栏(确实可以这样做),陶哲轩选择将问题描述转成Markdown格式

  • 最后,涉及需要GPT-4自己查找资料的内容,陶哲轩将它转变成一个引用注释,并在结尾给出网址。

完整的提问过程长这样:

c56e587d3aa52f2d71f722ba43a50bf8.png

也就是说,相比让GPT-4直接化身数学家去“解决问题”,陶哲轩只是把它当成一个提供灵感来源的“专家”,给自己建议一些研究的方向。

GPT-4很快给出了8个具体的建议:

1、理解问题:在深入证明之前,确保你理解了问题中的每一项。如果你不熟悉Diaconis-Graham不等式,研究一下它,了解表达式a(n)和R(n, q)中的每一项代表什么。

2、简化表达:有时候,复杂的表达可以被简化。例如,你可能想看看表达式中a(n)的二项式系数是否可以简化,或者是否可以用更简单的方式计算总和。

3、归纳法:由于R(n, q)是递归定义的,因此证明猜想的一种自然方法是使用数学归纳法。你可能想要证明,如果这个猜想对n成立,那么它对n+1也成立。

4、生成函数:另一种方法是使用生成函数。尝试找到a(n)和R(n, 0)的生成函数,然后证明它们是相等的。这有时可以把一个复杂的组合问题变成一个更简单的代数问题。

5、渐近分析:正如你提到的,分析a(n)和R(n, 0)的渐近行为可能会对它们的关系有一些深入的了解。这有时可以用斯特林的阶乘近似来实现,或者通过分析表达式中的主导项来实现。

6、数值证据:虽然不是证明,但收集数值证据有时可以让我们了解如何证明一个猜想。因为你有PARI/GP代码,可以用数值来检查猜想,你可能想读一读每个序列的前几项,看看是否能发现任何模式。

7、寻找类似问题:有时,一个问题或猜想是一个已知问题的泛化或变体。在组合文献中寻找类似的问题或定理,看看它们的证明是否可以适用于这个问题。

8、寻求反馈和合作:不要犹豫,从同事那里寻求反馈,或者在MathOverflow这样的论坛上发布你的部分结果。协作和同行评议通常是解决复杂数学问题的关键。

最终,陶哲轩使用建议4,也就是生成函数的方法,成功解决了问题。

0fe7d83bf6ea0605c63f755821ae462f.png
28261d439e9def9b908d023df1757d5b.png

当然,解决问题的过程并不需要用到GPT-4,采用MAPLE工作表+纸笔手动计算就能完成。陶哲轩也尝试了渐进分析(建议5)的方法,不过事实证明还是用生成函数更有效。

简单来说,陶哲轩只是用GPT-4给自己提供不同的解题思路,也就是“解题灵感”,但具体怎么解答,也就是更加数学的方法,他则不会交给GPT-4来完成。

至于“查资料”这种GPT-4的应用,陶哲轩也发挥到了极致。

例如在思考问题时,他还会把自己的“灵光乍现”拿出来和GPT-4讨论一下,例如他觉得这个问题和卡特兰数(Catalan numbers)有相似之处,希望GPT-4帮他查找一下对应的资料。

e2d21286b1699430341e6896196b1e8e.png

GPT-4很快给出了对应的回答,这也促使陶哲轩对另一个问题产生了新的灵感。

简单来说,陶哲轩在短短两段与GPT-4的对话中,展示了数学家使用GPT-4的正确姿势——找灵感和查资料。

这样一来,即使“数学菜鸡”如GPT-4,也能成为数学家的AI助理了。

大佬是怎么玩儿GPT的

分享人类大师和AI的聊天记录之余,陶哲轩的乳齿象博文里还附带着一份贴心指南,是他使用ChatGPT和GPT-4的经验之谈。

根据他过去的实操经验,最要紧的第一点:

不要试图让AI直接回答问题,因为这几乎肯定会得到一些看起来专业的废话

为了避免GPT成为废话文学大王,行之有效的方案如下:

让AI扮演合作者的角色,而后让它提供策略建议

Like this:

98bd3e172a231d6325f04fdef065357d.png

除此之外,“数学菜鸡”GPT,在大数学家手里能有什么用处?

陶哲轩大概的意思是酱婶儿的:

ChatGPT数学能力虽然不咋滴,但对做学术研究的人来说是个发散思维的好工具。

(对普通人来说有点不太专业,但对搞数学的学术人员来说刚刚好)

怎么解释用来“发散思维”这句话呢?

陶哲轩表达出来的观点是,既然ChatGPT在具体数学问题上给出的答案是不完全正确的,那不如索性发挥发挥它生成答案部分正确的特性。

简而言之,就是让它帮你找灵感balabalabla:

在处理数学问题时,可以让ChatGPT这类大语言模型做一些半成品的语义搜索工作
也就是说,ChatGPT不用提供确切的答案,只用生成一些可能的提示。

这样一来,依据GPT生成的提示+传统搜索引擎搜索,就能很轻松get答案。

b4f1a46fa53ced7e172be7a3e660dcc3.png

而且他还自曝,在GPT-4发布之前,他本人就从微软那里获得了访问资格

也就是和微软154页《AGI的火花》论文里同款,未经过安全训练但能力更强的满血版

16358b30c84e97a90b04e01b3c22fe20.png

从陶哲轩的反馈中可以看到,GPT-4非常擅长在和人类对话时进行一些cosplay,比如充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师,或者是魔鬼的代言人。

与此同时,对于AI在数学研究中的表现,陶哲轩给出的大胆却又严谨的预言:

当与形式证明验证器、互联网搜索和数学符号包等工具整合时,2026年的AI,如果使用得当,将成为数学研究中值得信赖的共同作者,而且在许多其他领域也是如此

712030d1d13cb2ccf2e902d8948d7d35.png

除了数学研究,GPT-4已经是陶哲轩生活中的全方位小助手了。

他经常使用GPT-4回答一些随意、措辞含糊的问题,这些问题以前需要在搜索引擎里精心调整关键词才行。

还有位同事,因为亲戚拿到重症诊断而郁郁寡欢。为此,陶哲轩让大手一挥,让GPT-4洋洋洒洒写了封慰问信。

结果呢?同事眼含热泪,被感动哭了。

cde52c2bc938f6536c15a158bae3b27e.gif

最后说回陶哲轩用GPT-4解决数学难题这事儿上来。

在MathOverflow下,有的网友觉得他不应该用GPT来回答数学问题,感觉是个很敏感的话题。

69389d4b63ed1688c19b856f2b8e9cd6.png

但还是有人表示了资瓷,表示觉得真的是泰库辣~

372bac9e45aeaa117f68c35fc616ad89.png

陶哲轩倒是毫不避讳地站出来表明了自己的立场,他倒不觉得有啥不好:

现在的担忧,跟维基百科流行初期时大家讨论的重点也没啥区别……
现在在维基百科上get初始线索,并且在引为论点时附上链接,展现它是我论据的一部分,都是大伙儿习以为常的事情。

并且陶哲轩看法还挺坚定,那就是“相信大家以后也会觉得用GPT来支持研究,没啥不妥当的呢”

c7849be0e126562834da7104ec4b1744.png

加入陶哲轩和GPT-4的对话:
https://chat.openai.com/share/53aab67e-6974-413c-9e60-6366e41d8414

参考链接:
[1]https://mathoverflow.net/questions/449361/elegant-recursion-for-a301897
[2]https://mathstodon.xyz/@tao/110601051375142142
[3]https://finmath.stanford.edu/~cgates/PERSI/papers/77_04_spearmans.pdf

点击进入—>【多模态和Transformer】交流群

最新CVPR 2023论文和代码下载

 

后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

多模态和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-多模态或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如多模态或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信号: CVer333,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!▲扫码进星球
▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看ca1e0ad83bd396d05521e791a54f24e9.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/63726.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

陶哲轩甩出调教GPT-4聊天记录,点击领取大佬的研究助理

量子位 | 公众号 QbitAI 鹅妹子嘤,天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT了! 就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用了GPT-4”,后者给他提出了一种可行的解决方法…

chatgpt赋能python:Python复制粘贴图片

Python复制粘贴图片 在Python中,复制和粘贴文件和文本是一项重要的任务。但是,你是否知道Python也可以通过复制和粘贴来处理图片?本篇文章将介绍如何在Python中复制和粘贴图片,并为SEO效果强化部分的内容着重标记加粗标题&#x…

【让油猴飞】01 TamperMonkey(油猴)的安装与使用

默子:博文内容部分无效,近日修改替换 \color{red}{默子:博文内容部分无效,近日修改替换} 默子:博文内容部分无效,近日修改替换 01 TamperMonkey(油猴)的安装与使用 TamperMonkey简介…

使用油猴(tampermonkey)自动答题

一、特别声明 1、本文章不保证该网站所提供的脚本安全、可用性及可靠性,请自行判断,如果无法判断请勿使用! 2、本文章仅作为学习用途,请勿用于非法用途 3、如果对你有用,请点赞及关注,谢谢 二、下载火狐浏…

[高等数学]这你不背?

求导及求微分的基本公式: 泰勒中值定理: 麦克劳林公式: 不定积分公式: 凑微分: 第二类换元积分法常用的三种情况: 求高阶导数的几个公式: 二阶常系数非齐次线性微分方程的特解: 排列组合公式: C的计算: 下标的数字乘以上标的数字的个数,且每个数字都要-1.再除以上标…

学习高数的最强APP软件 - 知能行考研数学

题目太多了怎么办,做也做不过来,而且做了也不知道自己学了些什么怎么办?一个网站帮你搞定,【知能行考研数学】,教你怎么练!! ​知能行智能教练,十小时掌握你不会的任何专题 比如函数…

考研数学高数1-1综合测试-函数及其性质

今天听完强化课之后去做学习包的题,发现没带平板,如果写到纸上,塞到书里又不知道去哪了,所以索性就拿Latex写了,虽然有一点麻烦,但是好在数量不多,就这么写吧。 都是我自己写的过程,…

高数计算机软件,扫一扫题目就能算高数!一款大学必备的高数神器

【PConline 应用】不知不觉到了开学季,已经有很多朋友迎来了大学的新生活,而不少学生读者也将会第一次接触那颗挂了很多人的树——高数。高数难不难?平心而论,用心学的话并不算特别难,但首次接触出现不适应的情况&…

做跨境电商的货源应该如何解决?

跨境电商作为电商行业中的一种,以海外商品的在线购买、支付行为,迅速占领市场并聚集了一大批用户群体。随着互联网行业的快速发展,更多的人开始选择做跨境电商了,但是很多人在做跨境电商的时候都非常的担心货源问题,那…

怎么做Shopee虾皮跨境电商?

众所周知,如果想让我们店铺的订单更多,流量更大,那么做好活动很重要。在虾皮的平台上。常见的活动有免运活动、返虾币活动、秒杀活动等大数活动还有各种主题活动。 面对这么多活动,我们有些卖家就选择有些手足无措了,不…

关于跨境电商你了解多少!我们应该怎么做跨境电商?(中)

四.具备跨境电商的能力是一件重要的事情 小编认识一个叔叔,他认为从事跨境电商很简单,瞧瞧人家创业轻轻松松年入百万,一年能买两套房,这肯定是稳赚不赔。还有周围有从事国内电商的好友,人家也是每天在家对着电脑&…

星淘惠:现在做跨境电商还有优势吗?跨境电商发展怎么样

近两年,我国跨境电商行业增长速度极快,有人看到跨境电商的红利来询问星淘惠现在还能入行跨境电商吗?这篇就来客观地分析一下跨境电商的优势以及发展前景。 国家制定了一系列优惠政策。从2012年到现在,基本上每两年发布一次跨境电…

跨境电商现在还好做吗?跨境电商需要注意什么?

时常收到一些小伙伴的提问:今年还能做跨境电商吗?不少人认为跨境电商发展已经进入所谓的寒冬期,但其实并不完全正确。我们所熟知的部分老牌跨境电商平台确实已经趋向饱和,但只要选择合适,运营得当,还是能很…

GPT-Engineer一夜爆火!一个提示生成整个代码库,GitHub狂飙19k星

来自:新智元 进NLP群—>加入NLP交流群 【导读】动嘴写代码指日可待!AI代码生成明星项目GPT-Engineer一夜爆火,短短几天狂揽19k星。 AutoGPT之后,又一个明星项目诞生了! GPT-Engineer一夜之间火遍全网,Gi…

AI 写的高考作文,你打几分?

又是一年高考时,高考真的是人生的一件大事,毕业这么多年,每次看到高考相关信息,还是会不由自主的点进来,其中语文的作文是每年大伙津津乐道的话题。 树先生今天就收到了某条小秘书的【邀请函】,邀请参与「…

【Mo 人工智能技术博客】采用 Python 机器学习预测足球比赛结果

采用 Python 机器学习预测足球比赛结果 足球是世界上最火爆的运动之一,世界杯期间也往往是球迷们最亢奋的时刻。比赛狂欢季除了炸出了熬夜看球的铁杆粉丝,也让足球竞猜也成了大家茶余饭后最热衷的话题。甚至连原来不怎么看足球的人,也是暗中…

chatgpt赋能python:Python出错提示:如何有效地理解和处理Python错误?

Python出错提示:如何有效地理解和处理Python错误? Python是一门流行的编程语言,用于各种应用程序和Web应用程序开发。当您正在编写Python代码时,您可能会遇到各种错误信息。这些消息通常是Python进行错误检测时,Pytho…

2020年中国智慧城市发展研究报告(附下载)

来源:前瞻产业研究院 本文多图,建议阅读5分钟。 报告深入分析我国智慧城市发展现状及趋势。 [ 导读 ]我国城市正处于新旧治理模式交替、城镇人口快速上升、信息技术蓬勃发展的阶段,智慧城市的出现和建设发展顺应了我国政策、社会、技术和实践…

《WeCity未来城市2.0白皮书》全文发布

全文共计899字60图,预计阅读时间12分钟 来源 | 腾讯研究院(转载请注明来源) 编辑 | 石煜倩 新基建浪潮之下,新型城镇化的建设正在加速,这为数字技术与经济社会融合带来了更多的想象空间;同时后疫情时代&…

未来城市技术v1.0

读《Wespace 未来城市空间》有感,跟大家聊聊城市相关的技术。 (清华大学建筑学院、腾讯研究院、腾讯云联合发布的报告) 我比较关注技术驱动下的应用,所以本文以技术的视角来表达我的一些观点。为了避免名词概念太多不好理解的情况…