面对ChatGPT引发的人工智能革命,中国如何应对?

ChatGPT是一款由美国OpenAI公司开发的自然语言人机交互应用,拥有接近人类水平的语言理解和生成能力,是迄今为止人工智能领域最成功的产品和历史上用户增长速度最快的应用程序。ChatGPT依赖大模型、大数据、大算力支撑,其出现标志着通用人工智能的起点和强人工智能的拐点,是里程碑式的技术进步,将引发新一轮人工智能革命。

国内人工智能“大模型”已具备一定基础,但与ChatGPT还存在一定差距,其背后面临数据、算力和创新环境等深层次制约。需从战略高度重视ChatGPT引发的新一轮人工智能革命,瞄准大模型、整合大数据、布局大算力,实施包容审慎监管,为新事物发展留足空间,加快抢占未来科技竞争制高点。

1.ChatGPT具有里程碑意义将旨发新一轮人工智能革命

ChatGPT是一款由美国OpenAI公司开发的自然语言人机交互应用,拥有接近人类水平的语言理解和生成能力,因其出色的回答问题、创作内容、编写代码等能力,使得人们直观真切地体会到人工智能技术进步带来的巨大变革和效率提升,上线5天用户突破100万,两个月活跃用户突破1亿,是迄今为止人工智能领域最成功的产品和历史上用户增长速度最快的应用程序。

ChatGPT是一个经过长期技术储备、通过大量资源投入、带有一定成功偶然性的人工智能“核爆点”。ChatGPT的发展经历了3个阶段(如下图所示),前期GPT-1(2018年)、GPT-2(2019年)、GPT-3(2020年)等版本已经投入了大量资源(包括购买高性能芯片、雇佣数据标注人员、占用计算资源等),效果并不理想,后期在采用“基于强化学习的人类反馈学习”技术后发生“蝶变”,迅速成为爆款应用。

 

ChatGPT关键在于“三大支撑”。

一是“大模型”。全称是“大语言模型”(Large Language Model),指参数量庞大(目前规模达千亿级)、使用大规模语料库进行训练的自然语言处理模型,是ChatGPT的“灵魂”。

二是“大数据”。GPT-1使用了约7000本书籍训练语言模型。GPT-2收集了Reddit平台(美国第五大网站,功能类似于国内的百度贴吧)800多万个文档的40GB文本数据。GPT-3使用维基百科等众多资料库的高质量文本数据,数据量达到45TB,是GPT-2的1150倍。

三是“大算力”。以GPT-3为例,其参数量达1750亿,采用1万颗英伟达V100 GPU组成的高性能网络集群,单次训练用时14.8天,总算力消耗约为3640PF-days(假如每秒进行一千万亿次计算,需要3640天)

ChatGPT标志着里程碑式的技术进步。

一是在最具挑战性的自然语言处理领域实现了革命性突破。相比视频、图像、语音等,自然语言的语法、语义、逻辑复杂,存在多样性、多义性、歧义性等特点。文本数据稀缺,通常表现为非结构化的低质量数据。自然语言处理任务种类繁多,包括语言翻译、问答系统、文本生成、情感分析等。因此,长期以来自然语言处理被认为是人工智能最具挑战性的领域。ChatGPT不仅实现了高质量的自然语言理解和生成,并且能够进行零样本学习和多语言处理,为自然语言处理领域带来了前所未有的突破。

二是标志着通用人工智能的起点。在此之前,人工智能在不同场景应用需要训练不同模型。而ChatGPT利用单一大模型即可完成人机对话、机器翻译、编码测试等多种任务,已经具备通用人工智能的一些核心技术和特征:能够自动化地学习各种知识、信息,不断自我优化;充分理解和流畅表达人类语言,逻辑推理强,实现了具备一般人类智慧的机器智能;拥有一定的自适应和迁移学习能力,可以适用于多种应用场景和任务。

三是代表着强人工智能的拐点。ChatGPT证明了大模型的学习和进化能力,将推动强人工智能(机器拥有知觉和意识,有真正的推理和解决问题的能力)加速演进。目前大模型智能程度已接近人类水平,甚至一些业界人士认为,将来会逐渐产生自我认知和感知,进而出现意识并且超越人类。

全球通用人工智能技术加速演进。ChatGPT涉及到“三大”中的“大模型”是核心和独门秘籍。当前,隐藏在ChatGPT背后的“大模型”正越来越多进入人们的视野。国际上已掀起从“大炼模型”到“炼大模型”的技术热潮。OpenAI公司将继续推进ChatGPT的模型演进,目前已发布多模态预训练大模型GPT-4,实现了几个方面跃升:强大的图像识别能力;文字输入上限提升到2.5万字;回答问题准确性明显提高;可以生成创意文本、歌词,实现风格变化等。谷歌创设了1370亿参数级大型自然语言对话模型LaMDA。当前正加快推出基于LaMDA的聊天机器人Bard,并动员全公司开展内测。微软与英伟达合作推出了5300亿参数的MT-NLG模型,与两家公司之前各自的系统相比,优点在于更加擅长各种自然语言任务,例如自动生成句子、问答、阅读和推理、词义消岐等。Meta公司复现了GPT-3,并对所有社区免费开放。

以ChatGPT为代表的人工智能大模型渗透到各行各业,将引发新一轮人工智能革命。从本质上看,ChatGPT是一个“大模型”(参数量巨大的概率模型),其成功实践充分证明了作为通用技术的大模型在人类社会各个方面布局应用的潜力。

一是成功探索了大模型的商业模式。ChatGPT已经应用于商用搜索引擎和办公软件,嵌入GPT-3.5的微软必应搜索引擎可以更好理解和响应用户查询,提供更准确的搜索结果,嵌入GPT-4的Office软件大幅提升了办公效率。

二是短期来看大模型将替代服务业的一些工作。ChatGPT可以完成各类文本生成任务,替代行政管理人员、科研人员、法律行业人士、媒体从业者、客服人员的部分工作。能够编码、检测安全漏洞,替代软件工程师的一些工作。可以高质量完成语言间的转换,替代翻译人员的部分工作。

三是随着大模型不断渗透,人们的生产生活方式将发生深刻变革。在不久的将来,广泛开发应用的大模型将以超出人类的速度和准确性来执行自动化生产、智能制造任务,赋能交通、医疗、金融等各个行业。这将会引发以强人工智能和通用人工智能为代表的新一轮智能革命,大幅提高生产效率,带来经济、社会和产业的深刻变革。

 

2.我国人工智能“大模型”现状与面临的问题

国内大模型已具备一定基础,但与ChatGPT还存在一定差距。

一是百度自主研发的“文心”大模型,参数规模达2600亿,已在能源、金融、制造等领域发布了11个行业大模型。

二是阿里达摩院推出10万亿参数的多模态M6大模型。

三是华为与鹏城实验室合作开发的盘古大模型,是首个全开源2000亿参数中文预训练语言模型,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出。

四是北京智源人工智能研究院推出1.75万亿参数的悟道2.0,可以同时处理中英文和图片数据。浪潮和中科院也分别推出了相应的大模型等。

 

从技术能力来看,专家判断当前国内技术比ChatGPT主要差在大模型环节,包括清洗、标注、模型结构设计、训练推理的技术积累。ChatGPT背后是文本/跨模态大模型、多轮对话、强化学习等多技术的融合创新,而国内大部分科技企业、科研院所多聚焦垂直应用,缺乏多技术融合创新能力。从落地应用来看,国内头部企业均表示已开展相关技术研发或部分模型进入内测阶段,但仍未出现与ChatGPT抗衡的大模型产品。加之大模型的训练成本较高,技术应用面临着亿元级研发投入和海量训练试错,国内企业投入严重不足,研发推广和产业落地整体落后于海外。

差距背后存在深层次制约因素,或使中美“大模型”差距进一步拉大,主要表现为三个“缺少”:

缺少高质量训练数据。GPT-3模型训练需要的语料75%是英文,3%是中文,还有一些西班牙文、法文、德文等语料集,这些学习语料可通过公开数据(如维基百科、百度百科、微博、知乎等)、开源数据集、网页爬取(训练GPT-3爬取了31亿个网页,约3000亿词)、私有数据集(如OpenAI的WebText数据集,收集了Reddit平台上的800万篇高赞文章,约150亿词)等方式获取。这些语料中,英文语料公开数据更多、质量更高。中文开源高质量数据少,特别是构建通用领域大模型的百科类、问答类、图书文献、学术论文、报纸杂志等高质量中文内容。同时,国内专业数据服务还处于起步阶段,可用于人工智能模型训练的经过加工、清洗、标注的高质量数据集还相对匮乏。缺少高质量训练数据已成为国内大模型训练的核心痛点。

缺少充足的智能算力支撑。一是大模型训练和运营算力成本高昂。训练阶段,目前业界测算ChatGPT训练成本约为1000万美元,为研发拥有部分ChatGPT能力的大模型,至少需要上千张A100训练卡。运营阶段,ChatGPT云计算成本每日约200万美元。二是缺乏大规模并行计算工程能力。满足大模型训练的算力需求不仅需要数量巨大的高性能GPU,更需要面向人工智能高度优化的云计算平台和相应的工程能力。三是采购国外先进GPU受限,国产算力尚未成熟到支撑大模型研发。国产智能芯片不仅在算力、带宽等性能上同英伟达A100、H100芯片有差距(这两款都在美方对华禁售之列),支持自然语言处理和大模型训练的算子库也不够成熟,国产替代仍有软硬适配等技术问题尚待持续优化与解决。四是人工智能算力市场和服务市场“碎片化”加剧。全国多地主导建设近百个智算中心,形成一个个孤立破碎的人工智能算力和服务小市场,中国大市场优势被消解。

缺少适合大模型研发特点的机制。一是力量分散。人工智能大模型具有长周期、重投入、高风险等特点。国内企业、高校在“大模型”“大数据”“大算力”等方面各有侧重,研发力量分散,资源缺乏整合,没有与OpenAI技术实力对标的企业。二是资金投入不足,企业受盈利压力很难长期维持高投入。政府项目的支持力度与所需投入相比仍显乏力,决策周期长。三是领军人才和核心团队缺乏。ChatGPT团队共87人,绝大多数拥有世界名校学历和知名企业工作经历。而国内人工智能顶级人才分散在不同机构中,很难形成掌握核心技术并且有强大工程能力和项目经验的领军人物和团队。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33699.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python拟合数据-一种强大的数据分析工具

Python拟合数据 - 一种强大的数据分析工具 Python是一种用于数据科学的强大编程语言。 它具有丰富的功能,具有大量的数据分析库和工具,其中包括拟合数据的功能。 在此文章中,我们将介绍如何使用Python拟合数据,并探索这种功能对数…

chatgpt赋能python:Python处理图片去白底的介绍

Python处理图片去白底的介绍 在现今的互联网时代,图片在网页设计和营销中占有重要的地位。然而,在制作图片时,如果图片中有一个白色底色,将导致图片的美观度和质量降低。因此,图片去白底是非常实用的技巧,…

最强的数据增强--ChatGPT?

在许多自然语言处理(NLP)任务中,文本数据增强是克服样本量有限挑战的有效策略。 目前的文本数据增强方法要么不能保证生成数据的正确标记(缺乏可信度),要么不能保证生成数据的足够多样性(缺乏完整性),要么两者兼有。 ChatGPT在具有无与伦比…

Chatgpt帮我写程序切分Midjourney生成的图片

背景:非程序员,只懂VBA,其他语言一概没入门。 这两天在尝试MJ在抖音上做图文的玩法,遇到一个问题,如何将MJ生成的一张4宫格图片切分成4张单独的图片,找了一圈,要是用图片处理软件,那…

爬取网易云音乐用户听歌排行,来制作一张Ta最爱歌手的词云图!

平时写代码的时候,作为云村用户的一员,我当然也是最爱开着网易云音乐(以下简称网易云)。大家都知道在网易云里你可以查看好友或是任意用户的听歌排行(假使Ta设置全部可见),但是如果想知道Ta喜欢…

【Python实战】爬取网易云音乐用户听歌排行,来制作一张Ta最爱歌手的词云图

前言 大家好,我是Samaritan。 平时写代码的时候,作为云村用户的一员,我当然也是最爱开着网易云音乐(以下简称网易云)。 大家都知道在网易云里你可以查看好友或是任意用户的听歌排行(假使Ta设置全部可见&am…

一招搞定某易云歌曲评论并生成漂亮词图,想爬什么歌就爬什么歌,练手推荐

网易云音乐一直是一个非常棒的听歌平台,尤其是推荐算法,我个人觉得是比某Q音乐更得人心,一直以来都用的都是网易云来听歌。 今天我就来教大家一个爬取网易云任意歌曲的评论并生成特殊词图的方法,对爬虫感兴趣的小伙伴们可以去试试…

足足 8 项新功能,微信可以和好友一同听歌了

本文转载自IT之家 此前,iOS 版微信已经陆续推出过 8.0.8 和 8.0.9 两次更新,加入了很多新功能,但安卓这边却一直没有动静。在历经了多日等待后,微信 8.0.9 安卓版也终于出现了。此次官方直接跳过了 8.0.8 这个版本,主…

最新【2021.1.28】今日头条_signature 分析

最新【2021.1.28】头条_signature 分析 【温馨提示】:此文仅适用PC端web版本某日某条加密 最新今日头条sign加密更新了,看了看,比之前的坑增加了许多; 今日头条web版的请求主要参数是:_signature,已经取消了之前的as、cp参数; 话不多说,开整。。。 1.参数定位 这个…

微信订阅号内测大改版,这一次更像「今日头条」了

微信订阅号想要「新生」。 2018 年 6 月,微信大部分用户都看到了自己的新版订阅号。在订阅号的改版中,文章变为了卡片式的内容展示。所有公众号不再分享一屏的手机屏幕,而是根据用户的阅读习惯,常读、收藏获得更大的卡片展示区域。…

如何实现今日头条跳转到微信?

说到付费搜索流量推广,大家第一时间想到的肯定是百度! 但真实做过百度的小伙伴知道,百度的智能推荐有多坑,如果没有自己调整成非智能推荐,那么流量费就会嗖嗖的消耗,却没有实际的收益。 头条的算法推荐跟…

今日头条最新_signature

本文仅供学习。 最新的今日头条sign参数的加密,链接是 https://www.toutiao.com/search/?keyword%E6%96%B0%E9%97%BB。 f12之后刷新网页 加密参数名称为_signature,然后全局搜索一下这个名字。 直接在这一行打断点,然后点击那个tacsign方法会到这里&a…

今日头条android+x86,GitHub - teajoyus/TouTiao: 今日头条 For Android

今日头条App 作为一个Web开发者,正好学校学习Android课程,所以跟着一起学习Android开发 ,作为我个人来说,学习一门语言不是看多少的书,而是首先上网学习基础知识,来github学习前辈们的项目源码,…

ChatGPT到底有多厉害,看看各个行业专家怎么说

我从2020年开始做AI传播,由于是非专业出身,这几年一直在努力学习和消化,也希望让更多非专业人士能懂AI。 ChatGPT(中文:小发猫)兴起后,我以最大热情去阅读论文和各种专业材料,包括反…

ChatGPT 因何爆火?

ChatGPT为什么会如此火热和流行呢?体验过的朋友应该都有类似的感觉:它的回答内容几乎和真人聊天的感觉类似,聊天的上下文有连贯的逻辑性,尤其让人震撼的是,它能够根据用户的描述直接写一段代码、写论文、写报告。 Chat…

智能医疗的主要应用场景和数据标注的关系

智能医疗是通过打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构、医疗设备之间的互动,逐步达到信息化。 随着科技的进步,医疗行业也将融入更多人工智能,使医疗服务走向真正意义上…

【AI+医疗】人工智能在健康业务和临床管理中的应用

来源:专知 本文为书籍介绍,建议阅读5分钟这本实用的书是第一本描述AI可以帮助解决有害的医疗保健问题的当前和未来用例的书。 人工智能将改变医疗健康的方方面面,包括我们管理个人健康的方式,从客户体验和临床护理到降低医疗保健成…

医疗知识图谱问答系统探究

1、项目背景 中科院软件所刘焕勇老师在github上的开源项目,基于知识图谱的医药领域问答项目QABasedOnMedicaKnowledgeGraph。 项目地址:https://github.com/liuhuanyong/QASystemOnMedicalKG 本人为小白,然后一步步完成的。 知识图谱构建&am…

服务器温度3d显示,智能问答助手、3D可视化展示,腾讯医典“黑科技”助力科普更有温度...

创新科技与医学科普的融合,将带来什么样的变化? 5 月21- 23 日,腾讯全球数字生态大会在云南昆明举办。在智慧医疗专场,腾讯医典正式发布其在医学科普领域的两大前沿探索:智能问答助手,借助系统化医学知识图…

医疗保健数据接口_医疗保健中的人工智能

医疗保健数据接口 Introduction 介绍 Artificial intelligence refers to simulating the behavior of humans, so that machines can be programmed to perform intelligent behavior and mimic human actions. It is a branch of computer science dealing with building sm…