大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生

量子位 | 公众号 QbitAI

ChatGPT诞生后的第一场全国高考,考生忙,大模型们也很忙。

这不,高考还没结束,AI挑战高考题就成了刷屏热搜话题,各家大模型都被拉出来写起了高考作文,甚至是参与整场考试。

(不知是不是巧合,Bard还在下午数学高考后,紧急升级了一波数学推理能力……)

结果,竟然有大模型写的作文,把资深高中老师都骗过了!

就在考试当天,百度搜索正在内测的“AI伙伴”,现场直播挑战了一套语文试题。

从“基础题”文言文翻译、阅读填空、古诗词赏析,到“拉分题”微写作和作文,AI伙伴全部上手做了一遍。

结果,当9份“混进”了AI伙伴作品的高考作文送到语文老师庄临旭手上时,他完全没发现有篇是AI写的:

我是真没想到,AI还能写文言文作文

紧接着,AI伙伴展现的文言文理解能力,更是把资深老师吓了一跳:

凭借我的教学经验来看,超过95%的同学没问题。

一整场直播下来,就连围观了AI伙伴考试全程的毕导都感慨:

再来一次高考语文,我可能考不过它……

所以,集成了百度语义检索技术+大模型能力于一身的AI伙伴,整场考试表现具体如何?

咱们一项一项展开来看。

“AI考生”现场挑战语文高考

先来看看大模型的“基础题”——古诗词赏析

面对情感和写法的“找不同”问题,百度搜索AI伙伴胸有成竹,不仅给出了明确的修辞手法,还进一步分析了古诗的来历和情感,属实是阅读理解十分到位了:

再到阅读填空。面对文章解读和“续写句子”能力,AI伙伴同样毫不逊色:

那么,来看看大模型的“拉分题”写微作文,依旧没什么问题!

要是小作文体现不出来,再来看看AI伙伴作诗的能力。不仅现代诗手到擒来,甚至连藏头诗都能搞定:

不过,要是再仔细一点搞搞提示词工程,AI伙伴似乎就答得更好了。

以高考语文题目中的古诗词理解为例,这里我们先在不给提示词的情况下,把题目原样“喂”给AI伙伴:

AI伙伴给出来的答案虽然也不错,但对于高考题目来说,这答案着实有亿点长,也有点太仔细了:

接下来,给AI伙伴换上强调“最重要的三个意象”的提示词。

果然,AI给出了更精准的回答,指出包括病柏、丹凤和鸱鸮在内的三个意象,是最关键的:

但是,上述都还只是直播中展现出来的效果。像AI伙伴这类有大模型加持的功能,其使用效果是否真的和提示词工程强相关?

为了测测AI伙伴的“真正实力”,我们亲自上手测了测它做高考题的效果。

直播中已经做过了全国甲卷的作文题目,那么我们再来试试今年上海卷的作文。

第一轮,我们直接把题目甩过去:

看起来,AI伙伴虽然理解了文章“主旨”,但写出来还差点意思:论点不够明确,作文的结构也不太清晰。

第二轮,我们试着换了一下提示词,给AI伙伴设置一个“角色扮演”效果。

首先,强调它是一名高考考生,然后给它“灌输”一些高考作文的写作技巧:

这一轮,AI伙伴写得就有高考作文内味了。

不仅给出了10字以内的标题,还按照总分总、夹叙夹议的方式,很好地写出了一篇议论文:

看起来,挖掘大模型的潜力,很大程度上确实要依靠提示词工程。

在直播中,百度集团副总裁、搜索平台负责人肖阳还给我们列举了一个非常简洁的提示词公式:

提示词 = 任务 + 角色 + 上下文背景 + 细节补充。

有了它,不用再担心大模型输出和设想无关的答案了。

当然,作为百度“用大模型重塑搜索能力”的终极杀器,AI伙伴能实现的功能,也远不止是做做高考题而已。

最早在2023万象·百度移动生态大会上官宣发布的AI伙伴,目前已经开启内测,获得试用资格后,可以直接从百度搜索界面进入:

它的本职工作,更像是一个搜索引擎端的全能AI助理,不仅具有智能搜索能力,还兼具创作生成技艺:

一方面,AI伙伴相当于一个对话版智能搜索工具。用它查资料,不需要再按关键词搜索,直接“用人话”提问就行:

不仅如此,每一句回答都有理有据,如果想要“追根溯源”,直接点链接就能跳转到对应的网站:

这样一来,就不用担心它会出现像ChatGPT整理文件那样,出现“无中生有”一些案件的操作了。

另一方面,它又相当于一个多模态大模型创作助手

不仅可以帮助查资料、写周报、画头像,还能陪你模拟面试、甚至替你约会(?)。

这里我们借助AI伙伴的“程序猿小助手”,来试试生成一段代码的能力。

以面试可能会考到的冒泡排序算法为例。

很快啊,几乎没有怎么思考,AI伙伴就给出了一段带注释的冒泡排序算法,最关键的是,它自己已经运行过,并成功输出了一段结果

这意味着我们不需要再自己去跑一遍这段代码,而是能直接将它交给面试官了(doge)

从上面这些展现的能力来看,AI伙伴所能做到的,远非仅仅提供高考试题“参考答案”而已。

这次选择用它挑战高考题,大家伙可能看的是个新鲜劲儿,但“术”的表象之外,更值得关注的是“道”的变化:

使得AI伙伴能在高考题面前依旧“神采飞扬”的大模型技术,正在以搜索引擎的代际变革为基点,席卷各行各业,甚至改变每个人的工作方式。

正如ChatGPT搅动风云之初,微软CEO纳德拉预测的那般:搜索正面临巨变。

并且变化的不仅仅是搜索的技术、产品本身,这一次,更与每一个个体有了更紧密的关联。

搜索三变

百度CEO李彦宏同样认为,“大模型即将改变世界”。基于这样的判断,李彦宏2023年一季度OKR,便指向了“引领搜索体验的代际变革”。

现在,三个月过去,大模型究竟如何变革搜索,现在答案已经越来越清晰。

从技术的角度出发,大语言模型的爆发,正在重新定义人机交互

对于人类而言,最自然的交流方式就是语言沟通。而大模型的代际突破,最直观的一点体现,就是机器自然语言聆听表达能力的飞速提升。

回答来自百度搜索AI伙伴

搜索本身,就是一种人机交互的核心方式。其本质的技术追求,就是要让机器更高效地理解、推理、表达,化复杂问题为直观的第一条搜索结果。

因此可以说,大语言模型的突破,正在全面激发搜索全新的潜能。

值得关注的一点是,伴随着AI的发展,搜索始终都是最前沿AI技术最先落地的场景。

以百度搜索为例,围绕“降低用户表达需求门槛”、“降低用户获取内容和服务的门槛”、“丰富搜索引擎的内容供给”这三个目标,百度搜索一直在AI技术上大量投入。

引入大模型之前,百度搜索已经实现:

  • 千亿级全网索引;

  • 全球领先的深度语义理解技术,相关成果曾获2020年国家技术发明奖二等奖;

  • 最大中文知识图谱,覆盖50亿实体。

从产品的角度看,过去三个月,数据已经证明,对话式搜索正在成为搜索引擎市场的一个新变量。

百度集团副总裁、搜索平台负责人肖阳就透露,大模型加持下的AI伙伴,在内测阶段就已爆火,相关搜索问答量激增。

这进一步佐证大模型带来的新人机交互方式,更能满足人们对搜索“快速”、“有效”的诉求。

牵一发而动全身,在现在这个时间节点,围绕搜索的内容生产和创作领域,创新模式也开始逐渐显现,并被积极地探索实践。

同样是在万象大会上,百度搜索还配合AI伙伴,推出了AI BOT解决方案。目的就是向内容、服务生产者释放大语言模型和AI技术能力,降低其与新搜索模式融合的门槛。

具体来说,百度搜索提供了创作者、商家、机构、服务和品牌等各类型的AI BOT,让他们能够利用自身优势和独特的内容、知识、服务,创造虚拟分身,直接回答用户的问题。

在技术和产品之外,更与每个人息息相关的,是用户搜索方式的改变

正如前文所展示的,大模型时代,“提问题”的能力正在变得越来越关键。

体现在现阶段,就是提示词写得好不好,会直接影响搜索生成结果的质量。是否掌握提示词工程能力,就像互联网时代开启时,是否掌握搜索能力一样关键。

对此,肖阳提到了“搜商”的概念:

未来不仅要卷智商、情商,还要卷“搜商”。

更好地使用提示词,更好地使用AI伙伴,获得的优势会越来越大。

也就是说,找到合适提示词的能力越强,越能在大模型落地应用的时代里,充分利用大模型的强大生产力。

可以说,大模型刮起的时代风暴之下,搜索三变,既是内在技术瓶颈的代际突破,亦是外在人类接触信息方式的彻底变革。

无怪乎肖阳作为技术变革的一线亲历者,会有这样的判断:

语义检索技术与大语言模型结合,促进搜索的理解、推理、组织和创作潜能进一步释放,有望在多方面催生颠覆式创新,促成搜索奇点降临

并且这一次,或许每一个人都会真真切切感受到这种代际变革带来的影响。

One More Thing

说起来,就在高考这两天,AI加持下的百度搜索,忙的还不止有刷题这件事儿。

每年此时,百度都会启动专门的高考服务,通过搜索和AI核心技术,为考生和家长提供便利。

今年,百度还基于AI技术,首次推出了高考搜索指数,涵盖专业搜索热度及变化趋势、“院校PK”等信息。考生家长在择校选专业的时候,可以更方面地参考对比。

AI志愿助手也进行了重大升级,能更直观地展示志愿预测结果,提供相关数据来辅助考生家长做决策。

对了,利用高考搜索指数和其他高考相关搜索数据,百度还联合中国教育在线掌上高考发布了不少有意思的数据:

高校方面,搜索热度最高的本科院校里,南方高校霸榜双一流和非双一流大学前十。

专科院校中,山东是搜索职业教育最多的省份。

专业方面,医学搜索热度断层第一,航空航天热度攀升最快。

而最有“钱”景的,是船舶电子电气工程……


卡奥斯开源社区是为开发者提供便捷高效的开发服务和可持续分享、交流的IT前沿阵地,包含技术文章、群组、互动问答、在线学习、大赛活动、开发者平台、OpenAPI平台、低代码平台、开源项目等服务,社区使命是让每一个知识工人成就不凡。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5347.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

任正非:过去3年,华为已完成1.3万个美国制裁器件的国产替代!(附:最新讲话实录)...

华为做为5G网络重要供应商,一直以来都是美国几轮出口管制目标,制裁也让华为无法从美国公司获取芯片,也不能利用美国设备来生产、设计自家芯片,拜登政府2022年还禁止在美国销售新的华为设备。 不过,近日,上海…

【观察】星环科技:布局行业大模型赛道,加速国产化替代进程

以ChatGPT和GPT所代表的大模型,已经在国内形成了“海啸效应”,几乎所有的科技公司都在想方设法进入大模型的赛道。背后的核心驱动力,就在于大模型的最大价值在于普遍提升个人生产力,而各行各业的公司都在积极寻找应用大模型和生成…

ChatGLM2-6B发布,C-Eval超GPT4,支持32k上下文!

自清华大学数据挖掘实验室(THUDM)3月开源ChatGLM-6B已经过去了3个多月,最近他们又带来了性能全面提升的“船新”版本-ChatGLM2-6B。别看名字变化小,其实更新的模型性能是又有量又实用。不了解ChatGLM的小伙伴可以看我这篇文章&…

苹果测试Siri自然语言生成功能;腾讯基于语言模型的短文本对话专利获授权;ChatGPT Plus订阅现已在印度推出丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 ChatGPT Plus 订阅现已在印度推出:支持最新 GPT-4 3月17日,据OpenAI官方推特消息,用于访问OpenAI文本生成人工智能的订阅服务ChatGPT Plus已经在印度推出。 OpenAI还继续在其…

OpenAI还在烧钱,但开发者已经利用GPT和Stable Diffusion挣钱了

衡宇 发自 凹非寺量子位 | 公众号 QbitAI Text-to-Video文生视频,继作文、绘画之后AI杀入的又一领域,有越来越多产品涌现。根据读者爆料,一款主打AI生成视频的产品,已经在小圈子内被频频提及,还是国产的。 量子位迫不及…

头部企业走入无人区,国产数智化厂商挑大梁

本文转自数智前线 文|石兆 编|游勇 央国企数智化与信创化双重需求叠加,国产厂商挑大梁,助力企业升级数智化底座,实现价值化国产替代。 4月,在北京用友产业园的数智剧院里,近千位来自30个行业…

基于Mathematica的机器人仿真环境(机械臂篇)

目的   本文手把手教你在 Mathematica 科学计算软件中搭建机器人的仿真环境,具体包括以下内容:    1 导入机械臂的三维模型    2 正\逆运动学仿真    3 碰撞检测    4 轨迹规划    5 正\逆动力学仿真    6 运动控制   文中的所有代码和模型文件都在此处…

ChatGPT向癌症开了一枪

出品 | 虎嗅医疗组作者 | 陈广晶编辑 | 陈伊凡头图 |《绝命毒师》剧照 经典靶点的奠基人到中国创业,会带来哪些改变? 前不久,一家名为赛得康的生物技术公司获得种子轮投资的消息,在医药行业媒体来了一轮“轰炸”。除了创业者之一宾…

MindNLP-基于Mindspore2.0的GPT2预训练模型迁移教程

前言 动机 大家好,我是Super_WZB,最近MindSpore快要上线2.0版本了,由于之前主要是参与MindSpore的开发工作,一直想找机会多用一用。而自春节开始也是参与到了一项基于MindSpore的迁移工作,积攒了一些经验&#xff0c…

做副业的我很迷茫,但ChatGPT却治好了我——AI从业者被AI模型治愈的故事

迷茫,无非就是不知道自己要做什么,没有目标,没有方向。 当有一个明确的目标时,往往干劲十足。但做副业过程中,最大的问题往往就是 不知道自己该干什么。 干什么?怎么干?干到什么程度&#xff1f…

国内外人工智能AI工具网站大全(一键收藏,应有尽有)

本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 国内外人工智能AI工具网站大全(一键收藏,应有尽有) 摘要一、AI写作工具二、AI图像工具2.1、常用AI图像工具2.2、AI图片插画生成2.3、AI图片背景移…

替代notepad++,notepad--介绍及插件cmake编译

Notepad 是一个文本编辑器小软件,用来替代windows自带的记事本。然而Notepad软件的作者太霸道,如果你不赞同他的观点,Notepad将会在你的源码里面插入随机字符。推荐一款国产的开源跨平台软件NDD(notepad--),功能一点儿不弱,体积小…

【LLM大模型】模型和指令微调方法

note Hugging Face 的 PEFT是一个库(LoRA 是其支持的技术之一,除此之外还有Prefix Tuning、P-Tuning、Prompt Tuning),可以让你使用各种基于 Transformer 结构的语言模型进行高效微调。AIpaca羊驼:让 OpenAI 的 text-…

开源ChatGPT要来了;软件2.0智能革命;GLM、Diffusion模型大加速

1. 2023年AI十大展望:GPT-4领衔大模型变革,谷歌拉响警报,训练数据告急 新年伊始,大模型的话题热度不减。ChatGPT展现的惊人能力将大模型研究和应用热度推向高潮,人们激烈讨论着这个高级“物种”的推出意味着什么。 本文…

被ChatGPT带热的最新技术岗:无需编码,年薪超200万

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年1月份热门报告合集 ChatGPT调研报告 ChatGPT团队背景研究报告 ChatGPT的发展历程、原理、技术架构及未来方向 ChatGPT使用总结:150个ChatGPT提示此模板 Ch…

AI提效工具|借助chatgpt快速读论文,快速总结、归纳、索引相似文章

目前新论文层出不穷,“快速阅读论文”成为研究者们一个必备能力。本文简单记录了近期出现的两个借助chatgpt来帮助我们快速读论文的“神器”,帮助大家快速上手应用,迅速提升论文阅读速度。 此外,本人也会定期更新记录一些类似的“…

获取全球各大证券交易所的全部股票交易信息

幻想过这样的两种能力,一是回到过去,二是预见未来。时间逆转回到过去,这更多的是在文艺作品中能够出现的情节。而预见未来,我们正在努力,希望可以更准确地预见更长时间内更多的细节。例如在瞬息万变的股票交易市场中&a…

如何使用chatGPT辅助开发复杂D3图表

如何使用chatGPT辅助开发一个复杂的D3图表 首先简单介绍一下实现的表单。 在线地址:https://2guliang.top/temperature/timeChat 引言 什么是 D3 D3 (Data-Driven Documents) 是一个基于数据驱动的 JavaScript 库,用于创建可交互的数据可视化图表。…

如何在代码开发中便捷使用 ChatGPT 协助开发

在五一节前后,抽空测试了下网上推荐的开发环境和开发插件,在这里推荐给前后端代码开发的同胞们。 方法一:IDEA 安装 插件 bito 习惯使用 IDEA 开发代码的同胞,可以尝试直接在 IDEA 中安装插件 bito,注意操作过程中需要…

ChatGPT 嵌入开发

为了提高问答「准确率」,有两个优化方向 1、增加训练集数据 2、增加提问上下文语料,答案就在其中 OpenAI 是不允许用户来训练数据的,他的 model 是固定且通用的。所以增加训练集数据并不可行。 使用chatgpt 嵌入,让chatgpt根据语料内容回答。 实际应用,产品客服、产品…