人美声甜GPT,数学题哪里不会讲哪里

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

大模型的颠覆和变革,还只是开始。

ChatGPT一炮而红,重塑搜索、办公协同等多个场景和行业后,在线教育,被视为最重要的垂直场景——毕竟大语言模型展示出的能力,正是之前在线教育、AI老师所亟需的。

而且这种趋势已经开始,背靠大模型相关的在线教育应用,已经率先在海外火爆。

看过来!让GPT化身二次元美少女AI家教来讲数学题的方案,每步都有解法,再不用担心看见参考答案的“略”字:

08cc4b28577cf1053b14443929918b61.png

基础到某个三角函数的定义,复杂到不同的解题方法与技巧,都能得到答案:

d3003e1ff1a703cebccafd5a74a1e14d.png

这就是最近在海外火爆的AI解题类应用,背后App已经在App store商店教育分类板块刷榜。

这种火爆在情理之中:背靠LLM,加上二次元画风颇似《原神》——不得不说,真实拿捏住了流量密码。

在这之前,在线教育行业的主流“AI家教”,背后的本质只是推荐算法,换句话说,就是推荐录好的教学视频或解题方法,但无法针对视频和方法中的某些细节给出解答

而现在,LLM涌现的解题准确性和语言理解能力,开始对之前可望不可即的技术实现带来了突破——不是在线教育面临重塑,是整个教育产业正在面临重塑。

背后技术原理:GPT+在线教育=?

二次元美少女家教身后,就是LLM在AI自动解题方面发挥着作用。

基本思路是在原有流程的一头一尾,接入LLM,与原有流程中的CLM(可计算语言模型,Computational Language Model)形成Joint Model模式。

CLM,相比其他AI模型展现出不错的逻辑能力,不过它在语言理解能力和输出等方面,遇上如今包括GPT-4在内的大语言模型还是相形见绌。

Joint Model模式,就是让LLM提供NLP能力CLM提供逻辑推理能力

c4f33fc9bb3448ff73554f85ef440d5a.png

也就是说,现在的整个AI解题的过程是这样的:

题干输入——LLM处理文本——CLM解题——LLM形成文本——讲解输出

二者结合,能完成的推理任务比单个模型处理的更复杂,并在必要时收集相关数据。

由是,AI家教能很好地理解题干内容,从而提供讲解。

在两端接入LLM之前,这条AI解题流程也能利用CLM,提供AI家教所需的数理逻辑和推理能力。

主要依靠CLM对文本信息进行数据升维,把一维文字信息进行高维展开,让机器在同一时间接受文本背后诸如实体、关系、参数、知识等多维度的隐含信息,理解题干背后最终想要求解的东西是什么。

再对CLM进行“部分不召回”设定,即“不能保证100%做对的题,AI不会输出结果”,从而保证AI家教的讲解和最终答案一定正确

43a44cbfc15ddcda221bffc5cfdbed37.png

这也能解释为什么现在的Joint Model模式中,对LLM的应用重点在NLP领域,而非逻辑和推理能力上——

GPT-3.5起,大模型毫无征兆地涌现出数理逻辑和推理能力,但它们既不稳定,也不绝对可靠,AI家教无法在接入后直接落地使用。

与其执着于纠正LLM的“胡说八道”,不如转而重点利用它相对稳定发挥的NLP能力。

二次元美少女AI家教背后是谁

有意思的是,这位AI家教背后还是一家中国公司。

来自悉之智能,2017年成立,核心创始团队都来自清北。

创始人兼CEO孙一乔,清华大学电子系2017届学生,在校期间参与搭建清华XLP超限学习团队,并深度参与校内某院系课程体系深度改革,带领数十人搭建了清华大学首个自适应学习引擎。

联合创始人兼CPO代佩霖,北京大学金融系毕业,曾入选福布斯亚洲30 under30;算法合伙人林东生,也毕业于清华大学电子系,是悉之智能自研CLM背后的发明者之一。

6066953c4c8c568bd2f89419c88c08db.jpeg

几位合伙从一开始杀入AI教育行业,就主攻自动解题

入局之初,还算赶上了个好时候,加上是国内第一家做出多模态解题家教的公司,成立次年就拿下新东方旗下“东方新创” 的1000万元天使轮融资。等到2020年,公司已完成近亿元A轮融资。

直到2021年经历双减风暴……

好在双减来临的同月,仍然顺利拿到2000万美金的A+轮融资,投资方是启明、经纬和真格等一线VC。

但是,公司业务重心不得不开始向海外市场转移。

等到在新的市场站稳脚跟开拓市场,涌现逻辑能力的ChatGPT却突然现世,突破了业界的传统认知,也打乱了他们的阵脚:

我们原本以为AI不会这么快出现逻辑能力。

不仅低估了OpenAI在GPT系列上的进度,还低估了GPT涌现出的能力的强度。

早些时候,谷歌用一个36B的LaTeX数据集Fine-tuning PaLM540B,在MATH上取得了50分。同一测试集上选出CLM覆盖的高中数学部分,悉之智得分在70分左右。

“比谷歌最引以为傲的PaLM得分高,也高于市场上的Photomath等产品,包括ChatGPT3.5最开始的解题能力得分也低于我们。”孙一乔边笑着复盘边挥舞胳膊,外化他的兴奋。

e88352f55c166731b46267b5547a344e.jpeg

结果GPT-4光速出现,出场即碾压所有玩家的解题能力。

但他好像并不沮丧,“这一波就是全世界看OpenAI装逼嘛,惊得谷歌的下巴都掉下来了”。孙一乔的逻辑里,OpenAI虐了全世界,悉之智能的AI又能虐其他人,“没什么不值得骄傲的。”

他还笑着补充,自家AI能力也不是为了刷榜好看,主要是能落到教育AI行业应用,这才是“至关重要”。

孙一乔很爱笑,熟悉他的人都这么说,尤其是在谈到GPT系列对传统带来颠覆性影响和可能性的时候。

3月底,欧盟批准谷歌收购了我们在国际市场上最大的竞争对手,也是传统解题公司的代表——PhotoMath。

每每提到这点,孙一乔都嘴角上扬,难掩兴奋,要埋下头用双手捂脸数秒来平复心情。

PhotoMath纳入谷歌麾下,有了技术、资金靠山,也代表着PhotoMath的一条快读通道被封死了——这家数学应用程序公司接入GPT-4及后续GPT系列API的可能性几乎为零。

但是GPT和CLM的组合,可以让解题能力继续突破。

这也是孙一乔“不沮丧”的数据支撑。在一个GPT-4解题率为82%的测试集上,悉之最新fine-tuning GPT的Joint Model最新解题率在92%。

究其原因,他的解释是Joint Model天然包含大量解耦好的NLP任务,最新工作中,团队把之前基于Bert的CLM换为fine-tuning后的GPT,将GPT作为预训练模型,将CLM作为逻辑校验模型,继续提高解题上限。

68b3a258aaafadf4e1531e5d6fd3b8cf.jpeg

孙一乔还表示,LLM不只提升AI家教背后模型的NLP能力,对多模态交互也有不少帮助

现在的AI家教形象,比以前声音更好听,形象也更好看。在接下来的计划中,对话交互能力也将得到增强,在授课过程中随时提问,都能得到AI家教的解答。

计划中,旗下AI家教还会拓展数学之外的学科版图,也将开启新一轮的融资。

2cfd97882fb52cb58206487e19637bf7.gif

深陷双减风暴之后,教育底色的公司们都逐渐找到了新的打法。

‍改弦更张的,如新东方,在直播领域大杀四方;继续探索在线教育之路的,悉之智能利用LLM提升解题能力,优化多模态交互,据悉,猿辅导也已经用AIGC在传统教育领域寻找新的机会。

LLM能力应用在教育领域后,不知道继续深耕在线教育的这些公司里,谁又是新一轮的最大赢家?

— 联系作者 —

896b2802286305b2e5c076e75ba05772.png

《中国AIGC算力产业全景报告》征集启动

AIGC算力需求爆发,谁将在此次算力产业变革中脱颖而出?

量子位《中国AIGC算力产业全景报告》《最值得关注的AIGC算力玩家》正式启动对外征集,期待有更多优秀的机构产品、案例与技术能够被大众看到。

48e32d6b9021294626d32e9562d7b564.png

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

outside_default.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/61447.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

除了方文山,用TA你也能帮周杰伦写歌词了

周杰伦几乎陪伴了每个90后的青春,那如果AI写杰伦风格的歌词会写成怎样呢? 首先当然我们需要准备杰伦的歌词,这里一共收录了他的十几张专辑,近5000多行歌词。 原文档格式: 第一步数据预处理 def preprocess(data):&qu…

Selenium+Request+Beautifulsoup(周杰伦,林俊杰歌词爬取)

爬去JZ的歌词是为了做一个NlLP的任务,这里是在python上使用SelenuimRequestsBeautifulSoup实现的。使用selenuim是因为会涉及到动态网页抓取,又使用Request的原因是selenium对网页抓取时是要先进行加载的因此很耗时间,而Request不需要网页加载…

爬取QQ音乐(周杰伦)

首先呢,我们打开QQ音乐搜索周杰伦 https://y.qq.com/portal/search.html#page1&searchid1&remoteplacetxt.yqq.top&tsong&w周杰伦 一切做好准备后呢,我们需要找到歌曲清单,找到client_search(客户端搜索&#xf…

【方向盘】轰动从未停止,感动从未消失。他,是周杰伦

不仅20年,不仅是青春。 本文已被https://yourbatman.cn收录;女娲Knife-Initializr工程可公开访问啦;程序员专用网盘https://wangpan.yourbatman.cn;公号后台回复“专栏列表”获取全部小而美的原创技术专栏 你好,我是方…

用Python分析周杰伦歌曲并进行数据可视化

大家好,今天我们用python分析下周杰伦歌曲。为了尽量完整地呈现从原始数据到可视化的过程,接下来我们会先简单讲解数据的预处理过程,即如何将 JSON 数据转化为Excel 格式,以及如何对周杰伦的歌曲进行分词。 本案例中的歌词数据来…

哪里可以免费听到周杰伦的歌曲?请看这里,教你免费听歌

前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。 小伙伴说想听周杰伦的音乐,有什么网站是可以免费听的,然后他发现咪咕音乐可以免费听周杰伦的歌曲,既然可以免费听,那…

计算机音乐谱大全告白气球,周杰伦《告白气球》钢琴曲谱

《告白气球》是由方文山作词,周杰伦作曲并演唱的歌曲,收录于周杰伦2016年6月24日发行的专辑《周杰伦的床边故事》中。2017年1月,这首歌曲获得Billboard Radio China 2016年度十大金曲奖。 创作背景 词作者方文山为周杰伦创作了《印地安老斑鸠…

周杰伦的歌里都有些啥?

周董的夕阳红粉丝团“被迫营业”,把蔡徐坤拉下了盘踞许久的微博超话人气榜第一,还一举破了亿。 当然,等我知道的时候,都战局已定了……作为当年会唱前三张专辑里所有歌曲的老粉,不想就这么躺赢,我今天也来给…

Python+pyecharts研究周杰伦歌词中的 秘密

一个朋友很喜欢周杰伦。 所以,前两天我跟别人去KTV,就唱的是“七里香”。 唱着唱歌,突然就好奇了起来。周杰伦的歌里,是不是还有很多的麻雀 后来发现,270首歌,140786个字,千言万语&#xff0…

周杰伦入局元宇宙,带你搞懂元宇宙怎么玩

自古以来,每个新兴产业的崛起,最关键、最重要的元素一定是流量,这对于元宇宙来说亦是如此。如果Facebook的入局元宇宙行业吸引了第一波市场流量,那么NBA球星史蒂芬库里、歌手林俊杰、周杰伦等明星入局的影响力就为“元宇宙”吸引了…

HTML网页设计:周杰伦网站

Hello朋友们!我们又见面了!是不是又到了焦头烂额忙期末设计的作业的时候了,不要担心,我来了,经过不懈的努力写出了一个比较容易懂的网页,完全足够应付你亲爱的老师的网页设计大作业! 哦&#xf…

用matlab演奏周杰伦的《七里香》

问题描述 前几天在学习matlab的时候,发现了一篇用matlab演奏音乐的文章,不禁感叹matlab居然还能这么玩!于是我就学着用matlab演奏我最喜欢听的一首歌——周杰伦的《七里香》。最后成果我已经发到B站,链接为:用matlab演…

WPF 消息传递简明教程

WPF 消息传递简明教程 独立观察员 2023 年 4 月 24 日 0、说明 参考:https://www.cnblogs.com/cdaniu/p/16852620.html 使用包:CommunityToolkit.Mvvm(8.1.0) 1、订阅 让需要使用消息的 ViewModel 继承 ObservableRecipient&#…

VMware官网注册账号之验证码问题

VMware官网注册账号之验证码问题 首先上个官网注册账号链接~ https://my.vmware.com/zh/web/vmware/registration 点我访问官网注册 然后不出意外都会看见中文版页面 这时候不要着急注册,因为你会发现验证码是这个造型的 抓狂的时候来了,不…

ChatGpt3.5 使用小记001

使用了一段时间的ChatGpt。主要的用途是向它咨询些学习的问题。因为有些它的分类是对话形式的,所以,一定问题多了,自己都不好找。故此想稍做整理,在此留存。 1.英语学习类 英语单词类,主要是因为有些近义词在中文的翻…

chatgpt赋能Python-python3_5怎么打开

Python 3.5怎么打开?教你几种方法 Python是目前非常流行的一种编程语言,几乎在所有行业都得到了广泛的应用。Python非常容易上手,且有强大的数据处理和科学计算能力。现在我们来说一下,如何在您的计算机上打开Python 3.5。 方法…

python-openCV实现银行卡卡号识别

实现效果: code import cv2 as cv import numpy as np# 轮廓排序 默认从左到右 # --cnts 待排序的轮廓列表 # --method 排序方法 自上而下,从左到右等 def sort_contours(cnts, method"left-to-right"):# 初始化反向标志和排序索引reverse F…

opencv之银行卡号识别

1.项目背景 1.1 项目介绍 这个一个opencv的经典应用,所以用它来熟悉之前的一些操作。 1.2 项目目的 通过此程序可以识别出银行卡图片中包括的银行卡卡号。 2.项目介绍 此项目主要分为两部分:模板图片处理,银行卡图片处理。 模板图片: 银行卡图片示例: 2.1 模板图片处…

【OpenCV】银行卡号识别

文章目录 前言一、环境二、代码总结 前言 本文引用其他作者代码,本文仅供记录用。详细内容可看此处 一、环境 如果提示没有imutils模块就pip install imutils 提供一个字体模板文件和银行卡图片。可以右键保存。 字体模板文件: 银行卡图片&#xff1b…