生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?

文章目录

  • 前言
  • 一、生成式 AI 的发展和现状
    • 1.1、什么是生成式 AI?
    • 1.2、生成式 AI 的发展趋势
    • 1.3、AI 生成内容的业务场景和分类
  • 二、生成式 AI 从分析领域到创作领域
    • 2.1、 降低内容创作门槛,增加 UGC 用户群体
    • 2.2、提升创作及反馈效率,铺垫线上实时互动
    • 2.3、基于海量数据激发创意认知、提升内容生产多样性
    • 2.4、模态元素二次拆解组合,改变内容生产逻辑及形式
    • 2.5、AI 系统或数据库联动,实现高度个性化/高频优化
  • 三、生成式 AI 改变内容创作和分发范式
    • 3.1、当前与未来设计工作流程对比
    • 3.2、AI 文生图存在最大的问题是什么?
    • 3.3、AI 从底层改变了哪些游戏规则?
  • 四、为何生成式 AI 迅速爆发和突破?
    • 4.1、大模型突破瓶颈
    • 4.2、多模态融合打破边界
  • 五、生成式 AI 技术趋势分析
  • 六、生成式 AI 无法产生创意的基本元素
  • 总结


前言

2023 年 3 月 27 日,百度文心一言正式发布,李彦宏开场即言,百度是首个做出可以对标 ChatGPT 的产品的大厂,作为“国产版 ChatGPT”、百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。在 2022 年 11 月 30 日 美国 OpenAI 研发的聊天机器人程序 ChatGPT 一经发布,就瞬间爆火全网,作为人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,“真正”像人类一样来聊天交流,随着不同版本的迭代和更新,我们可以看到众多使用者甚至能在其帮助下完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。百度文心一言能否与 ChatGPT “掰掰手腕”,在二者的背后又是什么技术趋势促使其火爆全网呢?本文我们一探究竟。

在这里插入图片描述


一、生成式 AI 的发展和现状

1.1、什么是生成式 AI?

生成式 AI(Generative AI) 是指计算机通过机器学习从现有数据中学习一个对象(物品、产品或任务)的要素,进而生成一个全新的、原创的、真实的、与原来内容相似的对象。作为重要的战略技术,在 2025 年 10+% 的数据将由 AI 创造

1.2、生成式 AI 的发展趋势

根据 Gartner《2021 年预测:人工智能对人类和社会的影响》 中预测:

  • 至 2023 年将有 20% 的内容被生成式 AI 所创建。
  • 至 2025 年,生成式 AI 产生的数据将占有所有数据的 10%,而今天这个比例不到 1%。

对于生成式 AI 的发展趋势预测,具体如下图所示:

在这里插入图片描述

1.3、AI 生成内容的业务场景和分类

在不含 AI 生成代码的情况下,AI 生成内容的业务场景和分类已经囊括众多的技术领域,AIGC 技术场景具体如下图所示:

在这里插入图片描述

二、生成式 AI 从分析领域到创作领域

2.1、 降低内容创作门槛,增加 UGC 用户群体

  • AIGC 能够代替人工完成声音录制、图像渲染等工作,使更多人员能够参与到高价值的内容创作流程中。预计这一效果在 2B 结构化内容生成的领域非常明显,个别场景会出现 2C 服务。跨模态生成成为未来重点。

2.2、提升创作及反馈效率,铺垫线上实时互动

  • AI 同样提升了内容的反馈生成速度,对于实时交互内容有重大意义,具有将线下和真人的快速交互迁移到线上的可能,也即令 AI 承担真人的社交、创作、协作功能,可能会出现新的潜在场景(如社交类和探索类游戏等)。我们在 Game AI 板块所提及的 AIbot 实时玩家教学在一定程度上提供了一种互动的新形式,交互教育/交互探索游戏虚拟陪伴场景值得期待。
  • 目前来看,内容消费者变得更容易将现实情感需求投射在虚拟世界中,预计会产生许多深入实时的互动需求,市场规模可观。

2.3、基于海量数据激发创意认知、提升内容生产多样性

  • 相较于人类艺术家,AI 能够接触借鉴更多的数据,在基于 prompt 进行内容生成后 AI 创作的内容会有更多的二次创造空间和自由度。例如,生成算法能基于特定条件或完全随机的生成现实中不存在的形状、色彩搭配、图案或结构等,赋予内容创作更多可能,产生“超现实感”及“未来感”,推动艺术创新。

2.4、模态元素二次拆解组合,改变内容生产逻辑及形式

  • 通过语音克隆、编曲风格提取等手段,AIGC 能够将原客体所对应的不同模态信息进行拆解,例如演讲者的面部形象、声音、演讲内容等。在重新组合之后,能够完成过往受到条件限制无法完成的工作。例如路人的声音 + 专业的播音逻辑、更符合特定审美的面部等,打破真人/真实场景在要素组合上具有的局限性。

2.5、AI 系统或数据库联动,实现高度个性化/高频优化

  • 在与特定的数据库(例如实时更新的客户数据、市场反馈数据、特定主题下的历史统计数据)或 AI 系统进行联动后(如个性化推荐系统等),AIGC 能够在更为精准的未来预测/个性化预测基础上调整其生成内容。
  • 例如,根据、根据所处渠道风格调整生成内容、参考历史数据优化生成内容等。该价值在内容用户习惯调整内容营销文本营销领域有重大意义

三、生成式 AI 改变内容创作和分发范式

3.1、当前与未来设计工作流程对比

  • 当前概念设计师工作流程:接到需求→搜集参考(图库)→构思出图→和甲方沟通修改。
  • 未来设计工作流程:创意→AI→创意。

3.2、AI 文生图存在最大的问题是什么?

AI 创作能力在未来短时间内的进步速度,也将取决于各行各业收集和训练行业优质数据的工作。

开发人员使用 AI 生成宠物小精灵,在初期使用“写实”数据集后发现运行效果不理想,重新使用 26 张新数据集训练 20 分钟,我们根据二者之间的对比,可以看到 AI 学习和生成效果是非常棒的,具体如下图所示:

在这里插入图片描述
AI 目前最大的问题不是“不够聪明”,而是“书读得太少"。 在 AI 新范式下创作,要考虑什么样的内容更利于 AI 学习和 AI 生成使用。

如果我们将艺术家关键词对生成图像的贡献视为艺术家本/的贡献,我们从原理上就可以为艺术家的创意价值定价了

3.3、AI 从底层改变了哪些游戏规则?

今天的 AI 从底层改变了游戏规则,接下来会看到以下变化:

  • 不会画画的人用 AI 生产高质量视觉作品。
  • 互联网上难以估量的图像数据被重新组织起来,围绕模型训练和数据标注出现新的生意。
  • 图片版权名存实亡,参与建立 AI 数据集成为艺术家的主要收益。
  • 传统图像处理软件、3D 建模软件被围绕 AI 范式建立的新工具取代。

四、为何生成式 AI 迅速爆发和突破?

在这里插入图片描述

4.1、大模型突破瓶颈

根据英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出的 “摩尔定律”:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔 18 个月翻两倍以上

而现在由于高效数据、高效算力、高效模型、高效知识需求的增长,摩尔定律原来中的 2 倍将增长至现在的 10 倍,具体如下图所示:

在这里插入图片描述
在 “The blessings of scale”中,根据趋势我们可以明确得知:同等条件下,随着模型参数量的增加,更大的模型会带来更好的结果,且目前的趋势并未饱和,故目前阶段大模型的投资依然会增加以获得更高的效益,具体如下图所示:

在这里插入图片描述

4.2、多模态融合打破边界

多模态融合打破边界,模型越来越大,模型走向行业,模型走向融合,具体如下表所示:

大模型趋势内容
模型越来越大探索极限,目前到 5000 亿仍然保持线性增长。越来越接近人脑神经元连接数,甚至超过。
例:OpenAl GPT-3(175B) 、谷歌 PaLM(540B)
模型走向行业在通用预训练大校型(L0)的基础上,在行业数据上更新训练后,适用于行业特征拍取的模型族(L1)。
例:煤矿模型,电力大模型,药物分子大模型等。商汤:INTFRN 系统(初学者-专家-通才);百度:行业大模型。
模型走向融合未来 2~3 年,视觉和语言大模型统一到多模态大模型,架构上也实现基本统一。各种校态大模型进行充分融合。
例:文本 + 视觉,语音 + 文本,文本 + 视频等 OpenAI DALL*E/E2;谷歌 Imagen;微软 GLIP 等。

五、生成式 AI 技术趋势分析

生成式 AI 技术的发展更趋向于:可控、高精度更快、更好、更便宜

可控高精度重建成为技术突破口,带来了超乎想象的结果,得益于 Diffusion model、语言大模型、跨模特大模型、Nerf 等技术的突破,具体如下图所示:

在这里插入图片描述

六、生成式 AI 无法产生创意的基本元素

生成式 AI,可控生成于机器而言,是不同语义的重组,于人而言,就是创意!在绘画领域,AIGC 是将绘画的三要素(构图、纹理、着色)进行重组从而产生创意。但是他并不能真的产生创意的基本元素,举例具体如下图所示:

在这里插入图片描述
图像生成,反事实是创意,但是对于语言生成,反事实却是灾难,可谓“恐怖如斯”,具体如下图所示:

在这里插入图片描述


总结

百度文心一言发布,股价盘中跌超 10%,也看到很多小伙伴们在试用文心一言后发出的吐槽,基于 Generative AI 的发展不是一朝一夕,这个问题的本质也并不是仅在文心一言中存在的,而 ChatGPT 确实在自然语言理解、自然语言处理等方面有进步的地方,同时,在算法、数据、算力上推进了有效结合。而面对 ChatGPT 的热潮,我们应有的态度正如科技部部长王志刚说所说,我们国家对于任何一个新的技术,包括 AI 技术出来以后,在伦理方面都采取了一些相应的措施,对科学技术发展趋利避害,让“利”更好地发挥出来。

在这里插入图片描述


我是白鹿,一个不懈奋斗的程序猿。望本文能对你有所裨益,欢迎大家的一键三连!若有其他问题、建议或者补充可以留言在文章下方,感谢大家的支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3402.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Fortinet谈ChatGPT火爆引发的网络安全行业剧变

FortiGuard报告安全趋势明确指出“网络攻击者已经开始尝试AI手段”,ChatGPT的火爆之际的猜测、探索和事实正在成为这一论断的佐证。攻守之道在AI元素的加持下也在悄然发生剧变。Fortinet认为在攻击者利用ChatGPT等AI手段进行攻击的无数可能性的本质,其实…

OpenAI chatGPT火爆出圈,世界悄悄发生着变化

OpenAI chatGPT火爆出圈,世界悄悄发生着变化 一、为什么突然火起来了?二、ChatGPT功能示例2.1 [AI聊天](https://chat.openai.com/chat)2.2 [AI写新闻稿](https://chat.openai.com/chat)2.3 [AI写代码](https://chat.openai.com/chat)2.4 [AI写论文](htt…

2.如何用chatgpt辅助撰写英文简历(同样可实用中文)

写在最前面的申明,我参考的方法源头来自于微博“梁钰stacey”的微博,同时结合自身校招需求,进行自我梳理和总结能够满足自身需求地一套流程方法,侵删。 首先,建议撰写中文简历大纲,并将其直接扔进谷歌翻译中…

ChatGPT会如何改变制造业?

来源 | Smart Industry Edgenesis编译 ChatGPT最新版本的发布成为热门头条。OpenAI表示该版本的ChatGPT能够在多个专业测试中达到“人类水平”的表现,例如司法考试和SAT考试。不过,在工业领域中,ChatGPT能够发挥怎样的作用呢?Sma…

fine tune openAI model ( 微调chatgpt)

了解如何为自己的应用程序定制模型。 介绍 微调可以从API提供的模型中获得更多信息: 比 prompt 设计更高质量的结果能够在超过 prompt 范围的示例上进行训练更短的 prompt 节省了token更低的延迟请求 微调包括以下步骤: 准备并上传训练数据训练一个…

ChatGPT之深度强化学习DRL理解

参考文献:Part 1: Key Concepts in RL — Spinning Up documentation In a nutshell, RL is the study of agents and how they learn by trial and error. (RL是对agent如何试错的一个研究)It formalizes the idea that rewarding or punishing an agen…

《花雕学AI》19:比较ChatGPT与新Bing在文章润色方面的应用优势与测试案例

引言: 文章润色是指对已经写好的文章进行修改、优化或完善的过程,以提高文章的质量和效果。文章润色涉及到多方面的内容,如语言表达、逻辑结构、文献引用、格式规范等。文章润色对于提升写作水平、提高论文发表率、增加学术影响力等都有重要意…

GPT润色论文的 10 个指令!

以下是 10个实际使用 ChatGPT 进行润色的例句: 1、精简文章内容: 输入“删除不必要的内容〞,可以删除文章中的冗余内容,使文章更加紧凌。例如:文章中有些内容并不是与主题相关,使其文章会更加简洁明了。 …

用GPT可以润色论文吗-chatgpt翻译润色软件

用gpt翻译润色可以吗 使用GPT(Generative Pre-trained Transformer)进行翻译和润色是可行的,因为GPT是目前自然语言处理领域中最受欢迎的预训练语言模型之一,它通过大规模的语料库训练而成,具备强大的自然语言理解和生…

英文翻译润色-chatGPT英文润色软件

chat英文润色英文会有问题吗 Chat GPT 英文润色输出的质量通常很高,但是在某些极端情况下可能会出现语言不连贯、逻辑混乱以及不准确的情况。这主要是因为英文语言的复杂性以及润色软件算法的复杂性决定的。因此,在进行英文润色时,最好是对输…

ChatGPT生成单元测试实践(Golang)

前言 目前gpt本质上是续写,所以在待测函数定义清晰的情况下,单元测试可以适当依赖它进行生成。 收益是什么: 辅助生成测试用例&测试代码,降低单元测试编写的心智成本辅助code review,帮助发现代码显式/潜在问题…

ChatGPT - 训练ChatGPT 自主生成Prompt

文章目录 训练ChatGPT 自主生成Prompt例子 训练ChatGPT 自主生成Prompt I want you to act as a ChatGPT prompt generator, I will send a topic, you have to generate a ChatGPT prompt based on the content of the topic, the prompt should start with “I want you to …

ChatGPT 生成的代码比你写的更不安全

出品 | OSC开源社区(ID:oschina2013) ChatGPT 是 OpenAI 发布的大语言模型聊天机器人,可以根据用户的输入生成文本,其中包括代码。不过加拿大魁北克大学的研究人员发现,ChatGPT 生成的代码往往存在严重的安全问题&…

1.1 ChatGPT背后的关键技术-预训练

1. ChatGPT的含义 ChatGPT的GPT对应的英文分别为Generative Pre-trained Transformer,意思是用到Transformer网络架构的生成式预训练模型。其中预训练也叫做自监督学习(Self-supervised Learning)或者是大模型(Foundation Model&…

从语言模型到ChatGPT,大模型训练全攻略

文|python 前言 你是否想过,为什么ChatGPT能够如此火爆呢?我认为这主要是因为ChatGPT提供了好玩、有用的对话式交互功能,能够为用户提供帮助,而不仅仅是依靠“大”模型的魅力。毕竟,GPT-3在2020年就已经推出…

训练ChatGPT的必备资源:语料、模型和代码库完全指南

文|python 前言 近期,ChatGPT成为了全网热议的话题。ChatGPT是一种基于大规模语言模型技术(LLM, large language model)实现的人机对话工具。但是,如果我们想要训练自己的大规模语言模型,有哪些…

CHAT GPT 训练流程 无标题】

伊桑CHAT GPT 训练流程 第一步:监督学习 收集人工编写的期望模型是如何输出的数据集, ​​​​并使用其来训练一个生成模型(GPT3.5-based) ​ 第二步:训练奖励模型 收集人工标注的模型多个输出之间的排序数据集…

借助ChatGPT爆火,股价暴涨又暴跌后,C3.ai仍面临巨大风险

来源:猛兽财经 作者:猛兽财经 C3.ai的股价 作为一家人工智能技术提供商,C3.ai(AI)的股价曾在2021年初随着炒作情绪的增加,达到了历史最高点,但自那以后其股价就下跌了90%,而且炒作情…

谷歌版ChatGPT灾难级发布,市值一夜狂跌7000亿,熬夜网友:退钱!

看完谷歌的最新直播,我感觉,微软被“诈骗”了。 谷歌CEO劈柴哥前脚刚发文说要推出ChatGPT竞品Bard,又有各种消息暗示2月8日晚上的发布会会有“新消息”。 不到24小时,微软就连夜上线了ChatGPT版搜索。 微软CEO纳德拉还非常重视…

ChatGPT已经杀疯了...

来源:机器之心 关于 AI 的问题,可以直接问 AI。 OpenAI 新上线的 ChatGPT 可谓是火爆出圈,这个对话模型可以回答后续问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug…… 只要和它聊上几句&#…