人美声甜GPT，数学题哪里不会讲哪里

人美声甜GPT，数学题哪里不会讲哪里

news/2024/12/28 21:26:54/文章来源:https://blog.csdn.net/QbitAI/article/details/130211944

衡宇发自凹非寺
量子位 | 公众号 QbitAI

大模型的颠覆和变革，还只是开始。

ChatGPT一炮而红，重塑搜索、办公协同等多个场景和行业后，在线教育，被视为最重要的垂直场景——毕竟大语言模型展示出的能力，正是之前在线教育、AI老师所亟需的。

而且这种趋势已经开始，背靠大模型相关的在线教育应用，已经率先在海外火爆。

看过来！让GPT化身二次元美少女AI家教来讲数学题的方案，每步都有解法，再不用担心看见参考答案的“略”字：

基础到某个三角函数的定义，复杂到不同的解题方法与技巧，都能得到答案：

这就是最近在海外火爆的AI解题类应用，背后App已经在App store商店教育分类板块刷榜。

这种火爆在情理之中：背靠LLM，加上二次元画风颇似《原神》——不得不说，真实拿捏住了流量密码。

在这之前，在线教育行业的主流“AI家教”，背后的本质只是推荐算法，换句话说，就是推荐录好的教学视频或解题方法，但无法针对视频和方法中的某些细节给出解答。

而现在，LLM涌现的解题准确性和语言理解能力，开始对之前可望不可即的技术实现带来了突破——不是在线教育面临重塑，是整个教育产业正在面临重塑。

背后技术原理：GPT+在线教育=？

二次元美少女家教身后，就是LLM在AI自动解题方面发挥着作用。

基本思路是在原有流程的一头一尾，接入LLM，与原有流程中的CLM（可计算语言模型，Computational Language Model）形成Joint Model模式。

CLM，相比其他AI模型展现出不错的逻辑能力，不过它在语言理解能力和输出等方面，遇上如今包括GPT-4在内的大语言模型还是相形见绌。

Joint Model模式，就是让LLM提供NLP能力，CLM提供逻辑推理能力。

也就是说，现在的整个AI解题的过程是这样的：

题干输入——LLM处理文本——CLM解题——LLM形成文本——讲解输出

二者结合，能完成的推理任务比单个模型处理的更复杂，并在必要时收集相关数据。

由是，AI家教能很好地理解题干内容，从而提供讲解。

在两端接入LLM之前，这条AI解题流程也能利用CLM，提供AI家教所需的数理逻辑和推理能力。

主要依靠CLM对文本信息进行数据升维，把一维文字信息进行高维展开，让机器在同一时间接受文本背后诸如实体、关系、参数、知识等多维度的隐含信息，理解题干背后最终想要求解的东西是什么。

再对CLM进行“部分不召回”设定，即“不能保证100%做对的题，AI不会输出结果”，从而保证AI家教的讲解和最终答案一定正确。

这也能解释为什么现在的Joint Model模式中，对LLM的应用重点在NLP领域，而非逻辑和推理能力上——

GPT-3.5起，大模型毫无征兆地涌现出数理逻辑和推理能力，但它们既不稳定，也不绝对可靠，AI家教无法在接入后直接落地使用。

与其执着于纠正LLM的“胡说八道”，不如转而重点利用它相对稳定发挥的NLP能力。

二次元美少女AI家教背后是谁

有意思的是，这位AI家教背后还是一家中国公司。

来自悉之智能，2017年成立，核心创始团队都来自清北。

创始人兼CEO孙一乔，清华大学电子系2017届学生，在校期间参与搭建清华XLP超限学习团队，并深度参与校内某院系课程体系深度改革，带领数十人搭建了清华大学首个自适应学习引擎。

联合创始人兼CPO代佩霖，北京大学金融系毕业，曾入选福布斯亚洲30 under30；算法合伙人林东生，也毕业于清华大学电子系，是悉之智能自研CLM背后的发明者之一。

几位合伙从一开始杀入AI教育行业，就主攻自动解题。

入局之初，还算赶上了个好时候，加上是国内第一家做出多模态解题家教的公司，成立次年就拿下新东方旗下“东方新创” 的1000万元天使轮融资。等到2020年，公司已完成近亿元A轮融资。

直到2021年经历双减风暴……

好在双减来临的同月，仍然顺利拿到2000万美金的A+轮融资，投资方是启明、经纬和真格等一线VC。

但是，公司业务重心不得不开始向海外市场转移。

等到在新的市场站稳脚跟开拓市场，涌现逻辑能力的ChatGPT却突然现世，突破了业界的传统认知，也打乱了他们的阵脚：

我们原本以为AI不会这么快出现逻辑能力。

不仅低估了OpenAI在GPT系列上的进度，还低估了GPT涌现出的能力的强度。

早些时候，谷歌用一个36B的LaTeX数据集Fine-tuning PaLM540B，在MATH上取得了50分。同一测试集上选出CLM覆盖的高中数学部分，悉之智得分在70分左右。

“比谷歌最引以为傲的PaLM得分高，也高于市场上的Photomath等产品，包括ChatGPT3.5最开始的解题能力得分也低于我们。”孙一乔边笑着复盘边挥舞胳膊，外化他的兴奋。

结果GPT-4光速出现，出场即碾压所有玩家的解题能力。

但他好像并不沮丧，“这一波就是全世界看OpenAI装逼嘛，惊得谷歌的下巴都掉下来了”。孙一乔的逻辑里，OpenAI虐了全世界，悉之智能的AI又能虐其他人，“没什么不值得骄傲的。”

他还笑着补充，自家AI能力也不是为了刷榜好看，主要是能落到教育AI行业应用，这才是“至关重要”。

孙一乔很爱笑，熟悉他的人都这么说，尤其是在谈到GPT系列对传统带来颠覆性影响和可能性的时候。

3月底，欧盟批准谷歌收购了我们在国际市场上最大的竞争对手，也是传统解题公司的代表——PhotoMath。

每每提到这点，孙一乔都嘴角上扬，难掩兴奋，要埋下头用双手捂脸数秒来平复心情。

PhotoMath纳入谷歌麾下，有了技术、资金靠山，也代表着PhotoMath的一条快读通道被封死了——这家数学应用程序公司接入GPT-4及后续GPT系列API的可能性几乎为零。

但是GPT和CLM的组合，可以让解题能力继续突破。

这也是孙一乔“不沮丧”的数据支撑。在一个GPT-4解题率为82%的测试集上，悉之最新fine-tuning GPT的Joint Model最新解题率在92%。

究其原因，他的解释是Joint Model天然包含大量解耦好的NLP任务，最新工作中，团队把之前基于Bert的CLM换为fine-tuning后的GPT，将GPT作为预训练模型，将CLM作为逻辑校验模型，继续提高解题上限。

孙一乔还表示，LLM不只提升AI家教背后模型的NLP能力，对多模态交互也有不少帮助。

现在的AI家教形象，比以前声音更好听，形象也更好看。在接下来的计划中，对话交互能力也将得到增强，在授课过程中随时提问，都能得到AI家教的解答。

计划中，旗下AI家教还会拓展数学之外的学科版图，也将开启新一轮的融资。

‍‍

深陷双减风暴之后，教育底色的公司们都逐渐找到了新的打法。

‍改弦更张的，如新东方，在直播领域大杀四方；继续探索在线教育之路的，悉之智能利用LLM提升解题能力，优化多模态交互，据悉，猿辅导也已经用AIGC在传统教育领域寻找新的机会。

LLM能力应用在教育领域后，不知道继续深耕在线教育的这些公司里，谁又是新一轮的最大赢家？

— 联系作者 —

— 完 —

《中国AIGC算力产业全景报告》征集启动

AIGC算力需求爆发，谁将在此次算力产业变革中脱颖而出？

量子位《中国AIGC算力产业全景报告》和《最值得关注的AIGC算力玩家》正式启动对外征集，期待有更多优秀的机构产品、案例与技术能够被大众看到。

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

点这里👇关注我，记得标星哦～

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/61447.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

周杰伦高清头像

周杰伦高清头像

阅读更多...

除了方文山，用TA你也能帮周杰伦写歌词了

除了方文山，用TA你也能帮周杰伦写歌词了

周杰伦几乎陪伴了每个90后的青春，那如果AI写杰伦风格的歌词会写成怎样呢？ 首先当然我们需要准备杰伦的歌词，这里一共收录了他的十几张专辑，近5000多行歌词。原文档格式： 第一步数据预处理 def preprocess(data):&qu…

阅读更多...

Selenium+Request+Beautifulsoup(周杰伦,林俊杰歌词爬取)

Selenium+Request+Beautifulsoup(周杰伦,林俊杰歌词爬取)

爬去JZ的歌词是为了做一个NlLP的任务，这里是在python上使用SelenuimRequestsBeautifulSoup实现的。使用selenuim是因为会涉及到动态网页抓取，又使用Request的原因是selenium对网页抓取时是要先进行加载的因此很耗时间，而Request不需要网页加载…

阅读更多...

爬取QQ音乐（周杰伦）

爬取QQ音乐（周杰伦）

首先呢，我们打开QQ音乐搜索周杰伦 https://y.qq.com/portal/search.html#page1&searchid1&remoteplacetxt.yqq.top&tsong&w周杰伦一切做好准备后呢，我们需要找到歌曲清单，找到client_search（客户端搜索&#xf…

阅读更多...

【方向盘】轰动从未停止，感动从未消失。他，是周杰伦

【方向盘】轰动从未停止，感动从未消失。他，是周杰伦

不仅20年，不仅是青春。本文已被https://yourbatman.cn收录；女娲Knife-Initializr工程可公开访问啦；程序员专用网盘https://wangpan.yourbatman.cn；公号后台回复“专栏列表”获取全部小而美的原创技术专栏你好，我是方…

阅读更多...

用Python分析周杰伦歌曲并进行数据可视化

用Python分析周杰伦歌曲并进行数据可视化

大家好，今天我们用python分析下周杰伦歌曲。为了尽量完整地呈现从原始数据到可视化的过程，接下来我们会先简单讲解数据的预处理过程，即如何将 JSON 数据转化为Excel 格式，以及如何对周杰伦的歌曲进行分词。本案例中的歌词数据来…

阅读更多...

哪里可以免费听到周杰伦的歌曲？请看这里，教你免费听歌

哪里可以免费听到周杰伦的歌曲？请看这里，教你免费听歌

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。小伙伴说想听周杰伦的音乐，有什么网站是可以免费听的，然后他发现咪咕音乐可以免费听周杰伦的歌曲，既然可以免费听，那…

阅读更多...

计算机音乐谱大全告白气球,周杰伦《告白气球》钢琴曲谱

计算机音乐谱大全告白气球,周杰伦《告白气球》钢琴曲谱

《告白气球》是由方文山作词，周杰伦作曲并演唱的歌曲，收录于周杰伦2016年6月24日发行的专辑《周杰伦的床边故事》中。2017年1月，这首歌曲获得Billboard Radio China 2016年度十大金曲奖。创作背景词作者方文山为周杰伦创作了《印地安老斑鸠…

阅读更多...

周杰伦的歌里都有些啥？

周杰伦的歌里都有些啥？

周董的夕阳红粉丝团“被迫营业”，把蔡徐坤拉下了盘踞许久的微博超话人气榜第一，还一举破了亿。当然，等我知道的时候，都战局已定了……作为当年会唱前三张专辑里所有歌曲的老粉，不想就这么躺赢，我今天也来给…

阅读更多...

Python+pyecharts研究周杰伦歌词中的秘密

Python+pyecharts研究周杰伦歌词中的秘密

一个朋友很喜欢周杰伦。所以，前两天我跟别人去KTV，就唱的是“七里香”。唱着唱歌，突然就好奇了起来。周杰伦的歌里，是不是还有很多的麻雀后来发现，270首歌，140786个字，千言万语&#xff0…

阅读更多...

周杰伦入局元宇宙，带你搞懂元宇宙怎么玩

周杰伦入局元宇宙，带你搞懂元宇宙怎么玩

自古以来，每个新兴产业的崛起，最关键、最重要的元素一定是流量，这对于元宇宙来说亦是如此。如果Facebook的入局元宇宙行业吸引了第一波市场流量，那么NBA球星史蒂芬库里、歌手林俊杰、周杰伦等明星入局的影响力就为“元宇宙”吸引了…

阅读更多...

HTML网页设计：周杰伦网站

HTML网页设计：周杰伦网站

Hello朋友们！我们又见面了！是不是又到了焦头烂额忙期末设计的作业的时候了，不要担心，我来了，经过不懈的努力写出了一个比较容易懂的网页，完全足够应付你亲爱的老师的网页设计大作业！ 哦&#xf…

阅读更多...

用matlab演奏周杰伦的《七里香》

用matlab演奏周杰伦的《七里香》

问题描述前几天在学习matlab的时候，发现了一篇用matlab演奏音乐的文章，不禁感叹matlab居然还能这么玩！于是我就学着用matlab演奏我最喜欢听的一首歌——周杰伦的《七里香》。最后成果我已经发到B站，链接为：用matlab演…

阅读更多...

WPF 消息传递简明教程

WPF 消息传递简明教程

WPF 消息传递简明教程独立观察员 2023 年 4 月 24 日 0、说明参考：https://www.cnblogs.com/cdaniu/p/16852620.html 使用包：CommunityToolkit.Mvvm（8.1.0） 1、订阅让需要使用消息的 ViewModel 继承 ObservableRecipient&#…

阅读更多...

VMware官网注册账号之验证码问题

VMware官网注册账号之验证码问题

VMware官网注册账号之验证码问题首先上个官网注册账号链接～ https://my.vmware.com/zh/web/vmware/registration 点我访问官网注册然后不出意外都会看见中文版页面这时候不要着急注册，因为你会发现验证码是这个造型的抓狂的时候来了，不…

阅读更多...

ChatGpt3.5 使用小记001

ChatGpt3.5 使用小记001

使用了一段时间的ChatGpt。主要的用途是向它咨询些学习的问题。因为有些它的分类是对话形式的，所以，一定问题多了，自己都不好找。故此想稍做整理，在此留存。 1.英语学习类英语单词类，主要是因为有些近义词在中文的翻…

阅读更多...

chatgpt赋能Python-python3_5怎么打开

chatgpt赋能Python-python3_5怎么打开

Python 3.5怎么打开？教你几种方法 Python是目前非常流行的一种编程语言，几乎在所有行业都得到了广泛的应用。Python非常容易上手，且有强大的数据处理和科学计算能力。现在我们来说一下，如何在您的计算机上打开Python 3.5。方法…

阅读更多...

python-openCV实现银行卡卡号识别

python-openCV实现银行卡卡号识别

实现效果： code import cv2 as cv import numpy as np# 轮廓排序默认从左到右 # --cnts 待排序的轮廓列表 # --method 排序方法自上而下，从左到右等 def sort_contours(cnts, method"left-to-right"):# 初始化反向标志和排序索引reverse F…

阅读更多...

opencv之银行卡号识别

opencv之银行卡号识别

1.项目背景 1.1 项目介绍这个一个opencv的经典应用，所以用它来熟悉之前的一些操作。 1.2 项目目的通过此程序可以识别出银行卡图片中包括的银行卡卡号。 2.项目介绍此项目主要分为两部分：模板图片处理，银行卡图片处理。模板图片：银行卡图片示例： 2.1 模板图片处…

阅读更多...

【OpenCV】银行卡号识别

【OpenCV】银行卡号识别

文章目录前言一、环境二、代码总结前言本文引用其他作者代码，本文仅供记录用。详细内容可看此处一、环境如果提示没有imutils模块就pip install imutils 提供一个字体模板文件和银行卡图片。可以右键保存。字体模板文件： 银行卡图片&#xff1b…

阅读更多...

最新文章

推荐文章