陶哲轩甩出调教GPT-4聊天记录,点击领取大佬的研究助理!

 Datawhale干货 

方向:GPT-4高级调教,来源:量子位

鹅妹子嘤,天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT了!

就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用了GPT-4”,后者给他提出了一种可行的解决方法。

02b884a1a1c04620c8a9b487b4f17da8.png

借助GPT-4,他不仅成功地突破了这一难题,还将答案分享在了MathOverflow上:

它给我提供了最终的解题思路,接下来我只需要继续计算就行。

为了给更多数学家分享用GPT-4工作的便利性,陶哲轩还将自己的聊天记录po了出来,里面完整地记载了他和GPT-4的对话。

f25ea4de4e7c1ed33595114e70f6dcc8.png

可以看见,在这份聊天记录中,他把GPT-4称呼为“专业数学合作者”,而不仅仅是一个普通的数学助手。

这个身份属实不一般了,不知道之后陶哲轩写论文的时候会不会把GPT-4列为共同作者(手动狗头)。

e1214bc85d8b1e1217b12de505e16cdd.png

不仅如此,戳对话记录底部的“continue this conversation”按钮,还能一键把对话记录导入自己的ChatGPT中,突然闯入人类大师和AI的交谈。

d2e6dedb0f0d01840a86aec409ba4f23.png

陶哲轩解决了什么新问题?

陶哲轩研究的问题,是一个两天前在数学网站MathOverflow上更新的提问。

74f90ee4c11bfd0ae23069a3ac72eab5.png

这个名叫“优雅的递归之A301897”问题,具体长这样:

19061e516c6ed9d19e6a303694b9056f.png

其中,A301897是一个被整数数列网站OEIS收录的数列:

5d8197f0cb8a67829d559f990ee8dfd9.png

这个数列中有一系列来自长度为n的排列b的数,它们有一个共同点,就是满足Diaconis-Graham不等式且等号成立。

Diaconis-Graham不等式由戴康尼斯(Persi Diaconis)和葛立恒(没错,就是“最大数”之父Ronald Graham)于1977年共同提出,属于概率统计方面的研究。

显然,这一大段提问中不仅夹杂着大量专业数学公式,而且还涉及需要跳转的网页资料

作为数学公认不太好的“数学菜鸡”,GPT-4真的能像一名专业数学家那样快速读懂公式、给出解决问题的专业建议吗?

事实上,相比直接把问题复制粘贴给GPT-4,陶哲轩做了三件事

  • 首先,做一些提示工程,明确GPT-4的“身份”和“目标”。其中身份是“一个擅长给技巧性建议的数学合作专家”,目标是“提供一些建议”而非解决问题。

  • 然后,相比直接把大段公式复制进GPT-4提问栏(确实可以这样做),陶哲轩选择将问题描述转成Markdown格式

  • 最后,涉及需要GPT-4自己查找资料的内容,陶哲轩将它转变成一个引用注释,并在结尾给出网址。

完整的提问过程长这样:

d66d6d02cdbcf1c3e1e116b2d0ec164e.png

也就是说,相比让GPT-4直接化身数学家去“解决问题”,陶哲轩只是把它当成一个提供灵感来源的“专家”,给自己建议一些研究的方向。

GPT-4很快给出了8个具体的建议:

1、理解问题:在深入证明之前,确保你理解了问题中的每一项。如果你不熟悉Diaconis-Graham不等式,研究一下它,了解表达式a(n)和R(n, q)中的每一项代表什么。

2、简化表达:有时候,复杂的表达可以被简化。例如,你可能想看看表达式中a(n)的二项式系数是否可以简化,或者是否可以用更简单的方式计算总和。

3、归纳法:由于R(n, q)是递归定义的,因此证明猜想的一种自然方法是使用数学归纳法。你可能想要证明,如果这个猜想对n成立,那么它对n+1也成立。

4、生成函数:另一种方法是使用生成函数。尝试找到a(n)和R(n, 0)的生成函数,然后证明它们是相等的。这有时可以把一个复杂的组合问题变成一个更简单的代数问题。

5、渐近分析:正如你提到的,分析a(n)和R(n, 0)的渐近行为可能会对它们的关系有一些深入的了解。这有时可以用斯特林的阶乘近似来实现,或者通过分析表达式中的主导项来实现。

6、数值证据:虽然不是证明,但收集数值证据有时可以让我们了解如何证明一个猜想。因为你有PARI/GP代码,可以用数值来检查猜想,你可能想读一读每个序列的前几项,看看是否能发现任何模式。

7、寻找类似问题:有时,一个问题或猜想是一个已知问题的泛化或变体。在组合文献中寻找类似的问题或定理,看看它们的证明是否可以适用于这个问题。

8、寻求反馈和合作:不要犹豫,从同事那里寻求反馈,或者在MathOverflow这样的论坛上发布你的部分结果。协作和同行评议通常是解决复杂数学问题的关键。

最终,陶哲轩使用建议4,也就是生成函数的方法,成功解决了问题。

dad6e606fb2bab2d5feea4335631d769.png
4a1afb08f02a33ef808874874e50ce80.png

当然,解决问题的过程并不需要用到GPT-4,采用MAPLE工作表+纸笔手动计算就能完成。陶哲轩也尝试了渐进分析(建议5)的方法,不过事实证明还是用生成函数更有效。

简单来说,陶哲轩只是用GPT-4给自己提供不同的解题思路,也就是“解题灵感”,但具体怎么解答,也就是更加数学的方法,他则不会交给GPT-4来完成。

至于“查资料”这种GPT-4的应用,陶哲轩也发挥到了极致。

例如在思考问题时,他还会把自己的“灵光乍现”拿出来和GPT-4讨论一下,例如他觉得这个问题和卡特兰数(Catalan numbers)有相似之处,希望GPT-4帮他查找一下对应的资料。

a94c8cce7a86f592ae0b8b13e36bbe9f.png

GPT-4很快给出了对应的回答,这也促使陶哲轩对另一个问题产生了新的灵感。

简单来说,陶哲轩在短短两段与GPT-4的对话中,展示了数学家使用GPT-4的正确姿势——找灵感和查资料。

这样一来,即使“数学菜鸡”如GPT-4,也能成为数学家的AI助理了。

大佬是怎么玩儿GPT的

分享人类大师和AI的聊天记录之余,陶哲轩的乳齿象博文里还附带着一份贴心指南,是他使用ChatGPT和GPT-4的经验之谈。

根据他过去的实操经验,最要紧的第一点:

不要试图让AI直接回答问题,因为这几乎肯定会得到一些看起来专业的废话

为了避免GPT成为废话文学大王,行之有效的方案如下:

让AI扮演合作者的角色,而后让它提供策略建议

Like this:

b9d5fdb61c7693f4c61dd01b136fded9.png

除此之外,“数学菜鸡”GPT,在大数学家手里能有什么用处?

陶哲轩大概的意思是酱婶儿的:

ChatGPT数学能力虽然不咋滴,但对做学术研究的人来说是个发散思维的好工具。

(对普通人来说有点不太专业,但对搞数学的学术人员来说刚刚好)

怎么解释用来“发散思维”这句话呢?

陶哲轩表达出来的观点是,既然ChatGPT在具体数学问题上给出的答案是不完全正确的,那不如索性发挥发挥它生成答案部分正确的特性。

简而言之,就是让它帮你找灵感balabalabla:

在处理数学问题时,可以让ChatGPT这类大语言模型做一些半成品的语义搜索工作
也就是说,ChatGPT不用提供确切的答案,只用生成一些可能的提示。

这样一来,依据GPT生成的提示+传统搜索引擎搜索,就能很轻松get答案。

3e8202966dd0224a1e799c78e2ad8bdd.png

而且他还自曝,在GPT-4发布之前,他本人就从微软那里获得了访问资格

也就是和微软154页《AGI的火花》论文里同款,未经过安全训练但能力更强的满血版

4c08bab4ffe873d8d4b89f50fbd977eb.png

从陶哲轩的反馈中可以看到,GPT-4非常擅长在和人类对话时进行一些cosplay,比如充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师,或者是魔鬼的代言人。

与此同时,对于AI在数学研究中的表现,陶哲轩给出的大胆却又严谨的预言:

当与形式证明验证器、互联网搜索和数学符号包等工具整合时,2026年的AI,如果使用得当,将成为数学研究中值得信赖的共同作者,而且在许多其他领域也是如此

4e4a2098e65d3c3f77cb49bc94075f6d.png

除了数学研究,GPT-4已经是陶哲轩生活中的全方位小助手了。

他经常使用GPT-4回答一些随意、措辞含糊的问题,这些问题以前需要在搜索引擎里精心调整关键词才行。

还有位同事,因为亲戚拿到重症诊断而郁郁寡欢。为此,陶哲轩让大手一挥,让GPT-4洋洋洒洒写了封慰问信。

结果呢?同事眼含热泪,被感动哭了。

7c31602a202984e07bc9bdf256896d2b.gif

最后说回陶哲轩用GPT-4解决数学难题这事儿上来。

在MathOverflow下,有的网友觉得他不应该用GPT来回答数学问题,感觉是个很敏感的话题。

ebef4ed2d4a6b7b0930d35e339ec2aae.png

但还是有人表示了资瓷,表示觉得真的是泰库辣~

f7edd1d6d20e59a1f23e69310066309c.png

陶哲轩倒是毫不避讳地站出来表明了自己的立场,他倒不觉得有啥不好:

现在的担忧,跟维基百科流行初期时大家讨论的重点也没啥区别……
现在在维基百科上get初始线索,并且在引为论点时附上链接,展现它是我论据的一部分,都是大伙儿习以为常的事情。

并且陶哲轩看法还挺坚定,那就是“相信大家以后也会觉得用GPT来支持研究,没啥不妥当的呢”

35297cacd08c44eb6de47f098dedf9a8.png

加入陶哲轩和GPT-4的对话:
https://chat.openai.com/share/53aab67e-6974-413c-9e60-6366e41d8414

参考链接:
[1]https://mathoverflow.net/questions/449361/elegant-recursion-for-a301897
[2]https://mathstodon.xyz/@tao/110601051375142142
[3]https://finmath.stanford.edu/~cgates/PERSI/papers/77_04_spearmans.pdf

7c6a428dd490025428312f9b51482138.png

干货学习,三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22588.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ESP8266还可以这样玩

作者:晓宇,排版:晓宇 微信公众号:芯片之家(ID:chiphome-dy) 01 巨型ESP8266 ESP8266几乎无人不知,无人不晓了吧,相当一部分朋友接触物联网都是从ESP8266开始的&#xff…

笑死!推特限流,微博赢麻了;使用ChatGPT撰写简历;SD电脑配置推荐;斯坦福67门AI课程学习路径 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 因 Twitter 限流,大量海外画师涌入微博哈哈哈哈 7月3日,马斯克突然发推宣布用户浏览数量限制,新账…

想要成为 NLP 领域的大牛?从 ChatGPT 的 5 大自然语言模型开始了解吧(LM、Transformer、GPT、RLHF、LLM)——小白也能看得懂

目录 前言ChatGPT基础科普——知其一点所以然1. LM2. Transformer3. GPT4. RLHF5. LLM 参考资料其它资料下载 前言 如果想在自然语言处理(Natural Language Processing,NLP)领域内脱颖而出,那么你一定不能错过 ChatGPT 的 5 大自然…

浏览器工作原理和实践

1.介绍 见正文3 2.应用背景 参透了浏览器的工作原理,可解决80%的前端难题. 帮助高效快速安全开发web前端项目. 3.学习 课程目录 开篇词 (1讲) 开篇词 | 参透了浏览器的工作原理,你就能解决80%的前端难题 宏观视角下的浏览器 (6讲) 01 | Chrome架构…

SpringBoot自动配置的模版引擎

文章目录 目录 一、Thymeleaf 1.什么是Thymeleaf? 2.什么是模版引擎? 3.JAVA中的SPI(Service Provider interface)机制? 4.META-INF目录是干嘛用的? 总结 前言 一、Thymeleaf 1.什么是Thymeleaf? hymeleaf是试用于Web和独立环境的现代服务器端Java模版引擎 目的:…

chatgpt赋能Python-python_lirc

Python-LIRC:让Python与遥控器无缝连接 介绍 Python-LIRC是一个Python语言的模块,它提供了一种接口,用于与Linux Infrared Remote Control(LIRC)系统进行通信。有了Python-LIRC,你可以轻松地将红外线遥控…

重磅!牛客笔试客户端可防ChatGPT作弊

上线俩月,月活过亿。 爆火的ChatGPT能代写文,撕代码,善玩梗,秒答题,几乎“无所不能”,争议也随之而来。 调查显示,截至2023年1月,美国89%的大学生利用ChatGPT应付作业,53…

学生用ChatGPT拿下全班最高分,教授惊呆

【导读】ChatGPT爆火两个月,整个教育系统都被颠覆了。学生用得不亦乐乎,而老师们迫不得已,纷纷打响了ChatGPT反击战。 ChatGPT已经让大学老师们受到惊吓了。 摸出门道的学生们,开始使用ChatGPT生成论文,得到了A的分数…

自然语言处理(NLP)之跳字(元)模型<skip-gram>与连续词袋模型<continuous bag of words>

自然语言处理(Natural Language Processing, NLP)是AI里的一个非常重要的领域,比如现在很火爆的ChatGPT,首先就需要很好的理解输入内容的意思才能够做出合理的回复。 自然语言处理应用非常广泛,比如机器翻译、问题回答、文本语义对比、语音识…

DeepMind:用 GNN 学习通用推理算法

文 | 智商掉了一地 小孩子才做选择,我的模型全!都!要! 近年来,基于深度神经网络的机器学习系统取得了巨大进步,尤其是在以感知为主的任务上。这一领域表现突出的模型通常要在分布中进行泛化,意味…

GPT-4发布:人工智能新高度,以图生文技术震撼,短时间内挤爆OpenAI模型付费系统

“GPT-4,起飞!”今日凌晨1点,OpenAI正式推出史上最强大的GPT-4文本生成AI系统 GPT-4:人工智能的新里程碑 你可能已经听说过GPT-3,它是一种能够生成自然语言文本的强大模型,可以用来回答问题、写文章、编程…

从BERT到ChatGPT,9大研究机构全面综述:「预训练基础模型」

来自:新智元 编辑:LRS 【导读】2023年了,还有人从头开始训模型吗?追踪一下从Bert以来的那些预训练模型。 ChatGPT在few-shot和zero-shot场景下展现出的惊人性能,让研究人员们更坚定「预训练」是一条正确的路线。 预训练…

【AI项目实战】某语言模型-stable diffusion-vits-cqhttp 实现能对话能语音能绘画的Q群机器人

好久没写文章了,终于想起来我有个博客账号系列。。 项目已开源在github上。 文章已滤敏,一切涉及语言模型名字的内容都以某语言模型代替 提示:AI绘画部分建议6G显存以上。 cqhttp 用于接收群友消息,并回复消息。 某语言模型 基于…

微信PC端各个数据库文件结构与功能简述 - 根目录

异想之旅:本人原创博客完全手敲,绝对非搬运,全网不可能有重复;本人无团队,仅为技术爱好者进行分享,所有内容不牵扯广告。本人所有文章仅在CSDN、掘金和个人博客(一定是异想之旅域名)…

springboot+vue集成websocket实现聊天功能

1、添加pom依赖 <!-- websocket --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId> </dependency> 2、创建一个config文件夹&#xff0c;在config文件夹中创建…

广州租房房价分析

利用八爪鱼爬链家网上广州市租房房源数据&#xff0c;网址为https://gz.lianjia.com/zufang/&#xff0c;爬取字段为价格、租赁方式、房型、楼层、面积、朝向、地铁、小区、位置、经度、纬度等&#xff0c;保存到E盘数据分析课程设计文件夹下&#xff0c;存为“gz_zufang.csv”…

房价数据分析

文章目录 一、数据预处理1、删除多余列2、缺失值、异常值处理 二、 数据探索分析1、DistanceKM与房价关系2、14岁及以下比重与房价关系3、自驾实际值与房价关系4、65岁及以上比重与房价关系5、人口占比与房价关系 三、机器学习预测房价1、模型选择2、模型调参 四、总结 一、数据…

北京二手房房价分析(建模篇)

数据科学俱乐部 中国数据科学家社区 本篇将继续上一篇数据分析用Python分析北京二手房房价之后进行数据挖掘建模预测&#xff0c;这两部分构成了一个简单的完整项目。结合两篇文章通过数据分析和挖掘的方法可以达到二手房屋价格预测的效果。 下面从特征工程开始讲述。 特征工程…

我国主要城市2023年房价数据

房价是一个城市发展程度的重要体现&#xff0c;一个城市的房价越高通常代表这个城市越发达&#xff0c;对于人口的吸引力越大&#xff01;因此&#xff0c;房价数据是我们在各项城市研究中都非常常用的数据&#xff01; 本次我们为大家带来的是我国主要城市的房价数据&#xf…

分析天津市房价的空间因素影响

所有代码与解析 # -*- coding: utf-8 -*- """ Created on Thu Mar 4 16:23:30 2021author: 89344 """import numpy as np import pandas as pd import matplotlib.pyplot as plt import warnings warnings.filterwarnings(ignore) from bokeh.…