文心ERNIE 3.0 Zeus千亿参数大模型,一键生成“学术范儿”论文标题

150a98713bb35e84e926f2952b192d6a.gif

文章整理自哔哩哔哩科技区UP主“同济子豪兄”(张子豪)的主题分享「文心雕龙,一键生成学术灵感」。

c3ad92d799710b0f51005caa60b18f8e.png

文心ERNIE 3.0 Zeus作为基于知识增强的千亿模型,在各类真实场景的生成准确性、流畅性、相关性上全面领先业界其他大模型,能提供多种参数量级的、具备超强的语言理解能力和文本创作能力。正因为如此,它能够举一反三,赋能各行各业,体现强大的泛化能力与通用性。我将在本次分享中介绍部分开发者基于百度文心ERNIE 3.0 Zeus制作的创意应用,并重点分享我在制作“一键生成学术灵感”系列创意应用的经验与心得。

背景介绍

我的工作主要集中在精读人工智能领域的经典论文,包括算法复现、代码实战、论文精讲等。我所涉及到的论文包含了计算机视觉和自然语言处理领域里的40篇经典论文,每一篇都是硕博士研究生准备论文文献综述、开题报告必读的经典论文。我对每篇论文都做了很详细的批注,对每一条公式、每一个单词、每一个图表、每一条结论都做了保姆级的详细教学,希望能够帮助大家节省宝贵的学习时间精力,降低学习门槛。

此外,我还做了很多人工智能的趣味案例,每个案例都具备完整的数据、算法、代码,且足够有趣,都可以作为一个毕业设计来展示。

02e2156f7f6c16a0bcdfbaf64bcde0db.png

在以上工作中,我接触并调用了百度文心ERNIE 3.0 Zeus知识增强大模型的技术能力。常言道“读书破万卷,下笔如有神”,文心ERNIE 3.0 Zeus在语言理解上有着出色表现。现在,大家可以在文心大模型官网API中心在线体验它的各种文本理解与创作功能,如写作文、对对联、写小说等,非常有趣。

7cc84f66fa07008bb16830db12537980.png

除了智商和情商双商在线之外,文心大模型在艺术领域也有独到的审美和品位。文心大模型中的图文双向生成跨模态大模型文心ERNIE-ViLG支持AI诗词作画,只要输入一句古诗,它就可以根据诗词中的意象,绘制出油画、水彩或者国画。此外,在文心官网开放API中心的文心ERNIE-ViLG文生图服务中开通探索无限权限后,用户还可以根据自己的描述来生成各种风格的图片,非常有趣。

057a83d3ab307b925c4d7edfee0020e1.jpeg

b1768bd9f7e8f7f863d947cd4357ea60.jpeg

94c5123f4f5eaeda1691239c438c0077.jpeg

左右滑动查看更多

此前,百度举办了一场“AI创意派”竞赛,开发者可以基于文心大模型做出各种各样、赋能各行各业、甚至你想象不到的一些趣味应用,从考古文言文到星座运势,到巡医问药,再到心理咨询。我来为大家举几个优秀的例子。

7d0356bec74d4993a868360ef46db5c9.jpeg

首先,为大家介绍哈工大李卓君同学团队制作的“文言文命名实体识别、人物关系、大事记”冠军应用。

我们国家的历史非常悠久,古籍浩如烟海,为了对这些古籍、古代文献进行数据挖掘,这个创意应用实现了对文言文中的人名、官职、地名、人物关系和重要历史事件一键解析。在真实的学术研究场景中,假设考古研究者发现了某历史人物的线索,通过该应用,可以快速将这个人物从已有的资料库中搜索出来,并匹配与其相关的人物关系与重要事件,这可以帮助我们挖掘尘封的历史真相,也大大缩短了资料搜集的时间,提高了研究效率。此外,它也是文言文学习的小助手,对文言文这类理解较为困难的文本信息,文心ERNIE 3.0 Zeus也能轻松应对。

e54a878a7e0804adeaa4fc013b911258.jpeg

为大家介绍的第二个案例是哈尔滨工业大学谢焕宜同学制作的“古风文案小能手”。与AI根据诗词作画不同,该应用是在用户输入图像后,为其生成相呼应的诗句。下图中的这些图片是我通过应用输入的内容,基于AI识别与分析,应用最终可以生成一句韵味无穷的诗:“醉后不知天在水,满船清梦压星河”,颇有浪漫主义的气质。

5d43462f6a734600dc98b50299950155.jpeg

通过以上案例,我们可以发现文心大模型的跨模态生成能力非常突出,既可以诗词生画,也可以画生诗词。

学术灵感

创意应用介绍

基于文心ERNIE 3.0 Zeus,我自己制作了一系列“一键生成学术灵感”创意应用,访问下方链接即可在线体验。

创意应用体验地址

https://easydl.zzh.coderai.cn/

b86d928468cc0fed25bf82e20aa97e8d.jpeg

我所制作的第一个创意应用是通过输入论文的摘要自动生成标题。在该应用中,点击“生成标题”,两秒钟后就可以生成一条非常“学术范儿”,且和真实学术论文极为接近的标题。

77383777e909e566eb1c16220a7b6f57.jpeg

我们知道,学术论文与文言文都是非常难读的一类文本信息,特别是人工智能专业的论文,要跨过编程、算法、学术、英语、文献查找等层层门槛。尤其是在中文学术圈里,论文的质量良莠不齐,论文的标题、摘要、作者、单位、关键词、引用关系、知识图谱关系非常复杂。所以,对于中文学术论文而言,做自然语言理解相关分析和处理是很困难的。

但是通过这个创意应用,我们会发现文心ERNIE 3.0 Zeus既能读懂文言文也能读懂中文的学术论文。我们在创意应用中输入“哲学”、“3D打印”、“区块链”、“元宇宙”、“增强现实”等专业术语,其生成的标题和真实学术论文标题极为接近。这说明,文心ERNIE 3.0 Zeus可以泛化到各个学科论文中,并能提取出核心研究对象、研究方法,将其按照学术语言表述习惯生成较为严谨的学术论文标题。

81cb7c817f74a2b89f615e85b0367ae2.jpeg

我所制作的第二个创意应用,在输入摘要后不仅可以自动提取关键词,还可以辅助我们找到对标的投稿期刊。这个应用主要解决了摘要生成问题上更难的一类任务——关键词提取。关键词是论文非常重要的一个元素,我们在百度学术上检索一篇论文,一般不是直接搜确定的论文标题,而是搜索相关的关键词,所以关键词往往比论文的标题更重要。关键词代表了论文的核心研究对象、核心研究方法和核心研究领域。文心ERNIE 3.0 Zeus则可以支持从一系列摘要中提取关键信息,并匹配出合适的期刊。

ceefdbed90bb5c2f893fe7df69e58f5a.jpeg

我所制作的第三个创意应用,实现了输入论文关键词后输出相匹配期刊名称及摘要的功能。因制作应用时生成字数有限制,所以不能生成太长的文本,但仍然可以看出,大模型所选择的期刊及其生成的摘要的开头是符合学术研究写作标准的。

91b6f5b49531ef2dd34e06f799ac1175.jpeg

我所制作的第四个创意应用,支持输入论文关键词后生成学术idea,如:输入“明朝”、“郑和”、“永乐”、“造船”,就可以生成一篇论文,内容是关于郑和下西洋时代我国的造船工艺。

ce29d387ca1a0df1c76194d1bac457d6.jpeg

学术论文是人类知识的载体,承载了人类最优秀的科学知识与文化成果。因此,对学术论文的数据挖掘尽管有一定挑战,但却是非常重要的一项工作。以上这些创意应用都有非常广泛的应用场景,比如:

  • 给论文、专利、图书取合适标题;

  • 将学术论文凝练成一句话,标明研究核心点;

  • 通过对生成“标题”查重,发现洗稿和灌水等学术不端行为;甚至是构建一个文献知识图谱,实现文献大数据挖掘,用AI筛选投稿期刊,寻找学科知名作者等等。

学术灵感创意应用

在飞桨EasyDL上的实现过程

接下来,我将为大家分享使用百度飞桨EasyDL开发上述创意应用的过程。

第一步,我们需要获得论文的数据集。本案例中使用了北京师范大学开源数据集,已获原作者授权使用。我们只需通过构建一张Excel表格,即可将所需数据输入给文心ERNIE 3.0 Zeus。该表格有2列,共9000行,每一行表示一篇论文,第一列是论文摘要,第二列是论文标题。我们通过将表格直接上传到飞桨EasyDL的方式,就能构建出应用所需要的数据集。

4677e65411909228b3a241c0b587b038.jpeg

第二步,针对不同的任务需求,我们需要进行数据预处理。

  • 如果要完成输入摘要生成标题的任务,表格中的数据需要呈现为一列摘要、一列标题的形式。

  • 如果要完成输入关键词生成学术idea的任务,则呈现为一列关键词、一列学术idea的形式。

  • 如果需要生成前缀,即需要包含“摘要”与“标题”的数据,并做好预处理。

我们只需在飞桨EasyDL里创建上传数据集,而其余数据去重、数据存储、数据上传等问题,飞桨EasyDL后台都会帮我们解决,不需要我们操心。

第三步,点击训练模型,创建文心ERNIE 3.0 Zeus自然语言生成模型。数据上传训练大概需要4-5小时,但GPU算力是免费的。我们可以在晚上休息之前开始训练,睡醒后,手机上就会收到飞桨EasyDL发送的”模型训练成功”通知短信,可以直接进入对模型在线校验和公有云部署阶段,便捷高效。

调用公有云API其实很简单,我们既可以在Web前端调用,比如网页端、微信小程序端,也可以调用自己写的Python脚本。我把飞桨EasyDL官方文档的API调用脚本做了80%精简后,可以实现同样的功能,即输入论文摘要的字符串,向API发起Http请求,解析返回后的结果就可以解析出标题和内容。

此外,我还制作了一个Web前端模板,只需要输入AK(API Key)、SK(Secret key)和API URL,无需服务器,即可在网页中直接调用飞桨EasyDL公有云API。

文心ERNIE 3.0 Zeus的

“心法”

文心ERNIE 3.0 Zeus确实可称得上“黑科技”,它利用大量的文本信息库与海量的算力,训练出了一个超大规模的通用语言模型。

预训练大模型的“大”体现在各个方面,训练数量大、消耗算力大、模型容量大、训练成本大、未来发展的潜力也大。在世界顶尖公司纷纷入场布局的背景下,文心ERNIE 3.0 Zeus作为一个知识增强、百亿参数的中文预训练大模型,在英文预训练大模型占主导的格局中立下了一席之地。

互联网上浩如烟海的中文网页得益于最大的中文搜索引擎百度,基于此,文心ERNIE 3.0 Zeus拥有海量无标注、无监督的中文文本信息库作为训练它的“粮草”。因而,它能够举一反三,赋能各行各业,体现强大的泛化能力与通用性。

作为创意应用开发者,面对已经预训练完成的文心ERNIE 3.0 Zeus,我们无需操心底层技术,只需要收集论文、摘要和标题数据集,让它自行训练,就能自行迁移学习进行泛化微调。我们不需要写代码,也不需要开发模型,更不需要调参练单,因为大模型已经见多识广,可以轻松地泛化到我们的小数据集上。

文心ERNIE 3.0 Zeus依托于内部完整的一套知识图谱,是一个知其然也知其所以然的模型。比如,它知道《夜莺》是安徒生以中国为背景写的一部童话。如果输入“发明加减消元法”的数学家所在的国家有哪些品牌汽车,它就可以在它的知识图谱里把”发明加减消元法”的数学家高斯,他所在的国家德国的汽车品牌解析出来,这其实也是知识图谱的技术,也是搜索引擎的技术。

其实,唐朝的杜甫就已经“预言”了预训练大模型的优势。杜甫说“读书破万卷,下笔如有神”,这句话可以解释成三重含义:

  • 第一重含义:文心ERNIE 3.0 Zeus,它学习了大量的文本信息,见多识广,正所谓“熟读唐诗三百首,不会作诗也会吟”。

  • 第二重含义:“神”,暗示了神经网络算法。

  • 第三重含义:“读书破万卷”,这个“卷”(juan,四声)也可以读成内卷的“卷”(juan,三声),预训练大模型能帮我们解决人工智能的内卷问题,开启全新的人工智能蓝海新时代。

此外,为大家简单介绍千言中文开源数据集,它可以帮你收集各种各样的训练模型“粮草”,这其中就包含了海量的中文自然语言处理数据。

最后,我以文心ERNIE 3.0 Zeus生成的对联做结语,期待未来文心大模型能够发展得更好,赋能更多应用场景。

文心雕龙,四面云山皆入画。笔墨飞鸿,九州春色尽归诗。

作者介绍

张子豪,哔哩哔哩人工智能科普教育UP主“同济子豪兄”,17万粉丝。

从土木工程自学人工智能和计算机视觉。代表作:精读AI经典论文、编程奇妙夜、斯坦福CS231N、CS224W中文精讲、OpenMMLab系列代码教程。

说明

“一键生成学术灵感”创意应用相关详细算法介绍、操作演示、数据和代码下载见视频:

https://www.bilibili.com/video/BV1W44y1g7cB

本文转载自:AI大模型

本文根据往届WAVE SUMMIT深度学习开发者峰会「AI大模型 智领未来」论坛嘉宾分享整理。WAVE SUMMIT+2022将于11月30日在深圳举办,欢迎大家扫码提前进入官方社群了解详情。

最新一期的WAVE SUMMIT+深度学习开发者峰会将于11月30日在深圳举办,欢迎大家扫码提前进入官方社群了解详情。

【2022WAVE SUMMIT+报名入口

6f143008bade507182a97feb9dfd07cd.jpeg

7097eb74990ff3afab713104096df9f2.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72176.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

飞浆AI studio人工智能课程学习(3)-在具体场景下优化Prompt

文章目录 在具体场景下优化Prompt营销场景办公效率场景日常生活场景海报背景图生成办公效率场景预设Prompt 生活场景中日常学习Prompt: 给写完的代码做文档 将优质Prompt模板化Prompt 1:Prompt 1:Prompt 2步骤文本过长而导致遗失信息的示例 步骤三:归纳输入情况,确定…

聊聊软件登录界面的设计与交互

前面说了一堆废话,想看代码的可直接看第二章。 版本记录 日期备注2020-06-13初稿 零、前言 这个登录界面提取自最近正在做的一个项目,此项目曾被我自豪地称为是公司数采软件的颜值担当,虽然这里面有不少夸大的成分,但也并非担不…

交互设计介绍

交互设计是一门需要结合用户体验和设计思维的复杂学科。作为Ul设计师,我们需要通过了解用户需求和市场趋势,以及深入了解产品的特点和功能,来设计出符合用户需求的交互方式,以提高产品的用户体验和用户满意度。以下是一些交互设计…

Midjourney助力交互设计师设计网站主页

Midjourney的一大核心优势是提供创意设计,这个功能也可以用在网站主页设计上,使用Midjourney prompt 应尽量简单,只需要以"web design for..." or "modern web design for..."开头即可 比如设计一个通用SAAS服务的初创企…

诚意满满的奉上2000套Axure原型图设计源文件UI UX交互设计案例

网络上的Axure教程看了很多,大多数都是讲软件如何操作,讲交互逻辑和用户体验的却寥寥无几,而实际项目中却非常重交互逻辑和用户体验。把这2000套原型文件一一拆解,慢慢分析作者的设计思路,会发现,互联网产品…

11个优秀的交互设计作品集

本文转自墨刀编译自Vanschneider的10 inspiring ux portfolios and why they work。 不管你做什么样的设计,一个在线交互设计作品集都是必备的。在大多数情况下,公司和客户根本不会考虑你是做什么工作的。虽然很多交互设计师可能认为自己的工作不能很好…

Websocket的基本认识、使用与封装

目录 一、Websocket是什么 二、Websocket的基本使用 使用介绍 第一步 第二步 第三步 第四步 常用API介绍 WebSocket(url[, protocols]) WebSocket.readyState WebSocket.send(data) WebSocket.close([code[, reason]]) WebSocket.bufferedAmount WebSocket.exten…

asp.net paypal信用卡支付功能

前段时间有个客户网站需要用到信用卡支付功能,客户有个Website Payments Pro的帐号,第一次做这东西花了很多时间在上面,已做好运行了一段日子, 现在总结一下: 1. 先注册一个paypal开发者帐号,这个主要用于s…

通义听悟诞生背后,AI大模型打响应用第一枪

配图来自Canva可画 2023年伊始,ChatGPT的爆火出圈,迅速引发了业界对于生成式AI应用的关注,AI大模型的竞争更是愈演愈烈。 作为参与其中的重要玩家,阿里云先是在4月11日举行的阿里云峰会上,推出了通义千问大模型。紧接…

开发私有chatGPT(二)openai前景展望

使用 OpenAI 的强大模型构建下一代应用程序。 GPT-3可以执行各种自然语言任务、Codex 可以将自然语言转换为代码的 ,DALLE,用于创建和编辑原始图像。 DALLE 开发人员现在可以开始使用,已经有超过3万人已经在使用DALLE来扩展他们的创造力并加…

快给你的对象做一个微信公众号播报吧-java版

一、前期准备 1.注册微信测试公众号 使用微信扫码登录此网站https://mp.weixin.qq.com/debug/cgi-bin/sandbox?tsandbox/login就能得到一个微信公众号测试号 推送消息需要用到的信息 用户扫码关注得到用户的id 编辑消息模板 此步骤的模板id、用户微信号id、以及自己的appID、…

2013年10月微软MVP当选名单揭晓!

微软公司于2001年8月起开始在亚洲与各大主要的第三方网站上的微软技术相关论坛合作,微软称之为“亚洲社区支持”计划。 为了鼓励大家在论坛中更好地互相帮助,共同提高,微软在全亚洲的微软论坛参与者中评选出那些技术水平高,积…

八大排序·希尔排序

大家好,我是安然无虞。 文章目录 希尔排序1.基本思想预排序 2.算法实现3.时间复杂度 遇见安然遇见你,不负代码不负卿。 插入排序分为两种:直接插入排序&希尔排序 希尔排序 1.基本思想 希尔排序是在直接插入排序基础上的优化&#xff0c…

十大排序之希尔排序

希尔排序 希尔排序(Shell Sort)是插入排序的一种算法,是对直接插入排序的一个优化,也称缩小增量排序。 希尔排序是非稳定排序算法。 希尔排序因DL.Shell于1959年提出而得名。 希尔排序是将待排序的数组元素按下标的一定增量分组 &#xff…

NBA球员出手位置分布图

小白一只,想转行互联网行业的数据分析,通过寒假的佛系学习对python有了一定的了解。记录一下第一个小玩意儿。 在刷crossin论坛的时候突然看到一篇关于NBA的数据分析,因为本身自己也非常喜欢打球,顿时就有了兴趣。 由于对python…

【八大排序(二)】希尔排序(谁说天才都短命?)

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:八大排序专栏⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学习排序知识   🔝🔝 Shell排序 1. 前言🚩2. 希尔排…

网络安全工程师需要考什么证吗?

目前网络安全行业,国内都有哪些证书可以考。 一、CISP-PTE (国家注册渗透测试工程师) CISP-PTE即注册信息安全渗透测试工程师,该证书由中国信息安全测评中心颁发,证书是国内唯一认可的渗透测试认证,专业性…

网络安全有哪些岗位?如何成为一名优秀的网络安全工程师?

网络安全是什么? 首先说一下什么是网络安全?其中,网络安全工程师工作内容具体有哪些? 网络安全 确保网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或者恶意的原因而受到破坏、更改、泄露,系统…

为什么说,网络安全工程师是网安行业的天花板?

为什么说,网络安全工程师是网安行业的天花板? 最近看到网上有很多人在问诸如:“怎样成为网络信息安全工程师”等相关问题,甚至还有人说“网络安全工程师已经成为这个行业的天花板”,这可能与近几年网络安全事件频发&a…

网络安全工程师必备的七大技能

网络安全有多重要 网络安全非常重要,因为在现代社会中,人们日常生活中的很多方面都与网络有关。随着互联网和数字技术的不断发展,人们已经变得越来越依赖网络,网络已经成为了商业、金融、通信、交通、能源、医疗、教育等各个领域…