对不起,AI大模型不是风口

观点| Mr.K   主笔| Wendy.L

来源| 技术领导力(ID:jishulingdaoli)

“我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”——5月26日,百度创始人、董事长兼CEO李彦宏先生在2023中关村论坛发表了《大模型改变世界》演讲。

李彦宏指出,大模型成功地压缩了人类对于整个世界的认知,让我们看到了实现通用人工智能的路径。

越来越多的人相信,第四次产业革命正在到来,而这次革命正是以人工智能为标志的。

人工智能技术再次成为人类创新的焦点,大模型在许多领域的应用越来越广泛,今年以来更是在全球掀起了狂潮。一夜之间,什么元宇宙、区块链、Web3.0之类的风口全都消失了,只有大模型才是唯一的C位。


01

AI大模型到底是什么?

大模型(Foundation Model)是指通过大规模的数据、算法和计算能力训练出的高精度深度学习模型,通常具有千万亿次的计算能力,可以在语音识别、自然语言处理、图像识别等领域,实现人类甚至超越人类的性能表现。

大模型通常有以下几大特点:

1、巨大的参数量:大模型通常包含数十亿个参数,需要大量的数据和计算资源来训练。

2、强大的内容生成能力:能够生成高质量的文本和图像,为自然语言处理和计算机视觉等领域的应用提供了强大的工具。

3、深厚的语义理解:能够理解文本和图像的深层语义信息,为自然语言处理和计算机视觉等领域的应用提供了深厚的语义理解能力。

4、高效的推理能力:能够进行高效的推理和推断,为自然语言处理和计算机视觉等领域的应用提供了高效的推理能力。

5、需要的计算资源较多:训练和推理需要大量的计算资源,如GPU和TPU等,需要高性能的计算集群和云计算平台。

提到大模型,我们不得不再次提起今年爆火的chatGPT来:

9394f74f48b924a5047c7db8a26c8417.jpeg

图:人工智能的四层架构

人工智能的四层架构分别是:算力层、框架层、模型层和应用层,其中:

1、算力层:主要包括芯片、处理器、云计算和超算等硬件等基础设施, AI需要有强大的计算能力来支持各种算法和应用的训练、推断和分析,算力层就是为人工智能提供强大的计算和存储能力的基础。

2、框架层:人工智能算法的开发需要使用各种编程语言和框架,框架层是人工智能的基石,例如TensorFlow、PyTorch、MXNet等。这些框架能够提供高效的计算图优化、分布式训练等功能,提高人工智能应用的开发和训练效率。

3、模型层:指的是在框架层中训练好的各种人工智能模型,包括深度学习模型、传统机器学习模型、强化学习模型等,典型的预训练大语言模型八廓openAI 的GPT、百度的文心大模型,以及Google的bard大模型等。这些模型是人工智能应用的核心,能够解决各种问题,例如图像识别、自然语言处理、推荐系统等。

4、应用层:应用层处于人工智能的最上层,指的是人工智能技术在各个领域的应用,例如智能客服、人脸识别、自动驾驶等。这些应用能够帮助企业和用户提升效率、改善体验、实现创新等,同时应用需求也会反向推动模型、框架和算力的升级和创新。

我们大多数人所接触到的AI,往往是处于应用层。

但是ChatGPT和文心一言比较特殊,既属于模型层,也属于应用层。

GPT是基于人工智能领域的大数据和机器学习技术,通过大量的训练和优化,可以用来生成人类自然语言的大模型;同时,它也是一个应用,可以通过与用户的交互和对话,提供有用的信息和帮助,比如回答问题、提供建议、生成文本摘要等。因此,他们处于模型层和应用层之间。

所以如果把每天来跟我们进行直接对话交互的chatGPT图文界面比喻成它的“嘴巴”,那么背后思考我们所提出这些问题的“大脑”,正是大模型这种东西。


02

国内外的大模型玩家有哪些?

在国外,大模型的研究起步较早,其中的重量级玩家主要包括谷歌、微软、亚马逊、Facebook等大型科技公司。

385495012e4b50bbdbdfc75809313697.jpeg

图:国外知名大模型简介

在国内,随着人工智能技术的不断发展,大模型的应用也越来越广泛。目前国内的大模型玩家主要包括百度、阿里巴巴、腾讯、华为等大型科技公司。其中,百度的文心一言、阿里巴巴的通义系列、腾讯的混元、华为的盘古等是大模型领域的代表作品。这些公司拥有庞大的数据和计算资源,以及丰富的应用场景,可以支持大模型的开发和应用。

f9bafbcc79615c613543cbea58b3967f.png


03

AI大模型,真的是风口吗?

“今天的初创公司,很多叫做大模型的,包括创业者,也包括互联网大厂我们都不 投。” ——嘉御基金创始合伙人、董事长卫哲表示嘉御基金会投有数据的具体应用,但不投大模型 。

今年以来,投资界对大模型相关公司出现了很微妙的态度:既有一些机构回避投资大模型公司,而与此同时,投资大模型的“入场券”(投资门槛)却悄然从5000万美元提高到了1亿美元。

5月7日,AIGC创建者大会在上海举行。线性资本创始合伙人兼CEO王淮发表了他的看法:“我们个人感觉这里面创业公司的机会相对小。”王淮表示,“历史上创业公司能够成功很大的原因是你‘为别人所不敢为’,或者做别人认为不会起来、不太看得重的东西,这一类的创业模式我们称之为‘桃花源式的创业’。而大模型需要一些必须成功的要素,要有算力,要有钱;在中国,还必须要有政府支持。”

从王淮等人的介绍来看,大模型的应用前景的确是非常广阔,但并不是所有企业和创业者都可以在这个领域取得成功,特别是中小创业公司。大模型需要大量的数据和计算资源来进行训练和优化,需要有强大的技术团队和丰富的应用场景来支持。对于中小企业和初创公司来说,进入大模型领域会面临很多困难和挑战。

究其原因,从我们前面说过的大模型的特点就可以看出来:

首先,大模型需要消耗大量的计算资源进行训练和优化,需要有足够的资金来支持,作为一个初创企业,就算融资到了独角兽级别,在大模型领域10亿美元这钱也根本不经烧。

其次,大模型的开发和应用需要有一个相对稳定且强大的技术团队和管理团队,需要大把大把很贵且很有经验的人长期来进行调参和优化。对于创业公司,其组织和管理经验往往不是很足,很难长期顺利运行下去这样的项目。

最后,由于大模型的应用场景非常广泛,因此其需要有丰富的数据和场景来进行不断滋养,作为一个没什么用户基础和数据基础的中小公司,很难训练得出来。

因此,对于中小企业和初创公司来说,还是需要谨慎考虑直接进入大模型领域。

cdd4e8c4288d90cc3829086bb50b0fbb.jpeg


04

创业的机会在哪里?

在这个时代,创业公司的机会和大模型的发展非常相似,长期发展一定是技术驱动为主,但在落地的时候对需求的拆解、分析、梳理和把控,也要综合考虑自身的实力和条件,以此来进行探索和发展。

而对于小的创业公司来说,可以考虑以下几方面:

1、基于大模型构建行业模型

正如李彦宏先生所说:“未来所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型,大模型会催生AI原生应用。未来需要用AI原生思维重构所有的产品、服务和工作流程。”

因此,中小企业可以针对不同的行业的特点和需求,在大模型的基础上,针对某个行业进行定制化的开发。比如,医疗、金融、能源等各个行业都有自己的痛点和需求,可以利用垂类大模型的能力来解决这些问题。

2、聚焦小场景

虽然大模型在通用自然语言处理任务上表现出色,但在针对性场景中,大模型性能可能不如专业化的小模型。

举个简单的例子,在语音识别的时候,如果有噪声干扰,或者比较小众地区的方言,通用的语音识别大模型可能就束手无策了,因此,小公司可以聚焦小场景训练小模型,针对特定的语音识别任务,如噪声干扰、不同口音等,以此提高性能,解决用户的具体痛点。

3、给大模型公司提供服务

“淘金“的活动风险高不说,而且还不是谁都能赚到,但是”卖水的生意“却是几乎恒定的稳赚不赔。未来随着行业的井喷,大模型掘金领域的“买水买锅铲”等需求会愈加强烈。因此,创业公司可以不急着构建自己的大模型,转身给大模型公司提供服务也是一个不错的选择,比如以下几个方向:

数据标注:数据标注是机器学习中重要的环节,创业公司可以提供数据标注服务,帮助大模型公司训练更好的模型。

环境部署:创业公司可以提供模型部署服务,帮助大模型公司将模型部署到生产环境中,使其能够更好地为用户提供服务。

监控和分析:所有大模型训练出来之后,都是需要不断更新和优化的,因此创业公司可以提供监控和分析服务,帮助大模型公司监测模型的性能和用户行为,帮助大模型公司优化已经训练好的模型,提高模型的精度和效率。

安全和隐私:未来随着AI应用的泛化,人的信息安全和隐私问题也必会愈来愈受到重视,因此创业公司可以提供安全和隐私服务,帮助大模型公司保护用户的数据和隐私,以便更好地遵守法律法规和保障用户安全。

号主简介

号主介绍:Mr.K,黄哲铿,国内知名IT管理专家,「顿悟山丘」咨询 创始人,科技媒体「技术领导力」创办人。畅销书《技术人修炼之道》《技术管理之巅》作者,曾担任壹药网 技术VP、1号店技术总监、海尔农业电商CTO。分享个体成长、团队管理、企业数字化转型、科技评论。

 -  END - 

关注K哥视频号,看直播讲干货!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30047.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国AI城市TOP10:天津首进前十,广州时隔四年重回第一梯队

丰色 发自 凹非寺量子位 | 公众号 QbitAI 年度中国AI计算力报告,刚刚出炉。 今年,已是连续第五年发布。 这一次,北杭深仍坐稳AI城市前三名,其中北京无可撼动,连续四年霸榜第一。 上海,还是第一梯队的“老熟…

【ERNIE Bot】百度 | 文心一言初体验

文章目录 一、前言二、文心一言介绍三、申请体验⌈文心一言⌋四、⌈文心一言⌋初体验1️⃣聊天对话能力2️⃣文案创作能力3️⃣文字转语音能力✨4️⃣AI绘画能力✨5️⃣数理推理能力6️⃣代码生成能力7️⃣使用技巧说明 五、总结 一、前言 ​ 最近有关人工智能的热门话题冲上热…

ChatGPT/AutoGPT,每日一问之“今天有什么好的赚钱方式”

以下是回答原文: Embarking on a new goal:今天网上有没有什么热门的高效的赚钱方式 Thinking...(Restart if this takes more than 30 seconds) Added task:Retrieve current popular methods for making money online Added task:Analyze and filter the ga…

程序员35岁危机就是个伪命题?他这么回答(文末附十大高收入专业)

最近张雪峰又上热搜了,因为劝退学医和新闻专业,引来各方人士包括专家的反驳批判,最终,张雪峰不敌,选择闭麦退场。 很多人抨击张雪峰,认为他太功利性,给别人推荐专业永远就只想着赚钱的专业&…

报告:Go/Rust 挑战 Java/Python 地位,AI 备受关注

在线学习平台 OReilly 最新发布了2023 年度技术趋势报告,基于该平台 280 万的用户数据,以了解开发人员的兴趣所在。调查结果表明,开发人员对生成式 AI 关键组件的兴趣正在加速增长:有关自然语言处理 (NLP) 的内容同比增长了 42%&a…

26岁年薪百万!华为最新“天才少年”曝光:B站博主,爱跳街舞

最近,据电子科技大学披露,2022年秋季校园招聘中,该校博士研究生宁博宇进入华为,成为“天才少年”项目一员,年薪百万。 宁博宇表示:“我只是一个普通学生,这次入选是我运气比较好!因为…

【一起撸个DL框架】1 绪论

CSDN个人主页:清风莫追欢迎关注本专栏:《一起撸个DL框架》GitHub获取源码:https://github.com/flying-forever/OurDLblibli视频合集:https://space.bilibili.com/3493285974772098/channel/series 文章目录 1 绪论 🍉1…

Openai+Coursera: ChatGPT Prompt Engineering(二)

这是我写的ChatGPT Prompt Engineerin的第二篇博客,如何还没看过第一篇的请先看我写的第一篇博客: ChatGPT Prompt Engineerin(一) Summarizing(总结/摘要) 今天我们的重点关注按特定主题来总结文本。 设置参数 import openai openai.api_…

【自然语言处理】【大模型】Chinchilla:训练计算利用率最优的大语言模型

Chinchilla:训练计算利用率最优的大语言模型 《Training Compute-Optimal Large Language Models》 论文地址:https://arxiv.org/pdf/2203.15556.pdf 相关博客 【自然语言处理】【大模型】CodeGeeX:用于代码生成的多语言预训练模型 【自然语言…

natapp反向代理

在我们开发中总会遇到这种需求,需要让我们本地的地址能被外网访问;(比如微信公众号的开发,这边需要与微信服务器进行交互) 为了完成这个需求,我们就可以是用反向代理,这边主要用到一个内网穿透…

正向代理与反向代理

函数是一等公民 // 新建函数类型 type HandlerFunc func(http.ResponseWriter, *http.Request)// 新建函数方法 func (f HandlerFunc) ServeHTTP(w http.ResponseWriter, r *http.Request) {f(w, r) }// 主函数 func main() {// 实例化函数hf : HandlerFunc(HelloHandler)// 创…

代理和反向代理

代理是代理的是用户(eg:浏览器); 反向代理是代理的是服务器(Nginx); 如下图: 常用的代理工具:Fiddler、Whistle、Charles 常用切换代理的工具:SwitchyOme…

反向代理HAproxy

HAProxy 介绍和架构HAProxy 安装HAProxy 基础配置HAProxy 调度算法HAProxy 高级功能 1 Web 架构介绍 2 HAProxy 简介 负载均衡:Load Balance,简称LB,是一种服务或基于硬件设备等实现的高可用反向代理技术,负载均衡将特定的业务(…

正向代理、反向代理介绍

目录 一、定义 1、正向代理(forward proxy) 2、反向代理(Reverse proxy) 3、透明代理(transparent proxy) 二、生活中代理的例子 1、正向代理 2、反向代理 三、代理的作用 1、正向代理的作用 2、反向代理的作用 目前大家提到的代理技术无外乎三种:正向代理…

代理、正向代理与反向代理

一、代理 1.1 什么是代理 代理也被叫做网络代理,是一种比较特殊的网络服务,允许一个终端(通常指客户端)通过这个服务与另一个终端(通常指服务器端)进行非直接的连接。例如:一些网关、路由器等…

如何下载一直播的回放视频

想下载一直播回放视频,然后就可以用播放器倍速观看了 (一)处理一下想要下载的视频 (二)使用ffmpeg将.m3u8格式文件转换成.mp4文件 (1)下载: 下载地址:windows版本 : http://ffmpe…

php对接腾讯云直播,聊天,im,云录制产生回放

首先先在腾讯云中开通这三项 IM中创建项目 云直播 解析推拉流地址: $domain $this->getConfig(anchor_push); //推流地址$domainpull $this->getConfig(anchor_pull); //拉流地址$streamName kangfuyuan.$res; //直播间ID(唯一的&am…

心法利器[84] | 最近面试小结

心法利器 本栏目主要和大家一起讨论近期自己学习的心得和体会,与大家一起成长。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。 2022年新一版的文章合集已经发布,累计已经60w字了,获取方式看这里&…

Visual Studio 2022 集成虚幻引擎功能

【CSDN 编者按】微软作为全球著名的游戏厂商,其在游戏制作与开发体验上也积极下功夫。在听取了游戏开发人员的反馈后,Visual Studio 2022 正式集成 Unreal Engine (UE、虚幻引擎) 作者 | David Li 责编 | 梦依丹 出品 | CSD…

苹果:付费才能用 iOS 开发者预览版,网友吐槽:找 Bug,还得先交 99 美元?

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 以后要尝鲜 iOS 开发者预览版,要先付费,才能测试? 苹果的更新说明 近日,苹果最新公布的一项政策引发了不少开发者的争议,其表示,从…