观点| Mr.K 主笔| Wendy.L
来源| 技术领导力(ID:jishulingdaoli)
“我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”——5月26日,百度创始人、董事长兼CEO李彦宏先生在2023中关村论坛发表了《大模型改变世界》演讲。
李彦宏指出,大模型成功地压缩了人类对于整个世界的认知,让我们看到了实现通用人工智能的路径。
越来越多的人相信,第四次产业革命正在到来,而这次革命正是以人工智能为标志的。
人工智能技术再次成为人类创新的焦点,大模型在许多领域的应用越来越广泛,今年以来更是在全球掀起了狂潮。一夜之间,什么元宇宙、区块链、Web3.0之类的风口全都消失了,只有大模型才是唯一的C位。
01
AI大模型到底是什么?
大模型(Foundation Model)是指通过大规模的数据、算法和计算能力训练出的高精度深度学习模型,通常具有千万亿次的计算能力,可以在语音识别、自然语言处理、图像识别等领域,实现人类甚至超越人类的性能表现。
大模型通常有以下几大特点:
1、巨大的参数量:大模型通常包含数十亿个参数,需要大量的数据和计算资源来训练。
2、强大的内容生成能力:能够生成高质量的文本和图像,为自然语言处理和计算机视觉等领域的应用提供了强大的工具。
3、深厚的语义理解:能够理解文本和图像的深层语义信息,为自然语言处理和计算机视觉等领域的应用提供了深厚的语义理解能力。
4、高效的推理能力:能够进行高效的推理和推断,为自然语言处理和计算机视觉等领域的应用提供了高效的推理能力。
5、需要的计算资源较多:训练和推理需要大量的计算资源,如GPU和TPU等,需要高性能的计算集群和云计算平台。
提到大模型,我们不得不再次提起今年爆火的chatGPT来:
图:人工智能的四层架构
人工智能的四层架构分别是:算力层、框架层、模型层和应用层,其中:
1、算力层:主要包括芯片、处理器、云计算和超算等硬件等基础设施, AI需要有强大的计算能力来支持各种算法和应用的训练、推断和分析,算力层就是为人工智能提供强大的计算和存储能力的基础。
2、框架层:人工智能算法的开发需要使用各种编程语言和框架,框架层是人工智能的基石,例如TensorFlow、PyTorch、MXNet等。这些框架能够提供高效的计算图优化、分布式训练等功能,提高人工智能应用的开发和训练效率。
3、模型层:指的是在框架层中训练好的各种人工智能模型,包括深度学习模型、传统机器学习模型、强化学习模型等,典型的预训练大语言模型八廓openAI 的GPT、百度的文心大模型,以及Google的bard大模型等。这些模型是人工智能应用的核心,能够解决各种问题,例如图像识别、自然语言处理、推荐系统等。
4、应用层:应用层处于人工智能的最上层,指的是人工智能技术在各个领域的应用,例如智能客服、人脸识别、自动驾驶等。这些应用能够帮助企业和用户提升效率、改善体验、实现创新等,同时应用需求也会反向推动模型、框架和算力的升级和创新。
我们大多数人所接触到的AI,往往是处于应用层。
但是ChatGPT和文心一言比较特殊,既属于模型层,也属于应用层。
GPT是基于人工智能领域的大数据和机器学习技术,通过大量的训练和优化,可以用来生成人类自然语言的大模型;同时,它也是一个应用,可以通过与用户的交互和对话,提供有用的信息和帮助,比如回答问题、提供建议、生成文本摘要等。因此,他们处于模型层和应用层之间。
所以如果把每天来跟我们进行直接对话交互的chatGPT图文界面比喻成它的“嘴巴”,那么背后思考我们所提出这些问题的“大脑”,正是大模型这种东西。
02
国内外的大模型玩家有哪些?
在国外,大模型的研究起步较早,其中的重量级玩家主要包括谷歌、微软、亚马逊、Facebook等大型科技公司。
图:国外知名大模型简介
在国内,随着人工智能技术的不断发展,大模型的应用也越来越广泛。目前国内的大模型玩家主要包括百度、阿里巴巴、腾讯、华为等大型科技公司。其中,百度的文心一言、阿里巴巴的通义系列、腾讯的混元、华为的盘古等是大模型领域的代表作品。这些公司拥有庞大的数据和计算资源,以及丰富的应用场景,可以支持大模型的开发和应用。
03
AI大模型,真的是风口吗?
“今天的初创公司,很多叫做大模型的,包括创业者,也包括互联网大厂我们都不 投。” ——嘉御基金创始合伙人、董事长卫哲表示嘉御基金会投有数据的具体应用,但不投大模型 。
今年以来,投资界对大模型相关公司出现了很微妙的态度:既有一些机构回避投资大模型公司,而与此同时,投资大模型的“入场券”(投资门槛)却悄然从5000万美元提高到了1亿美元。
5月7日,AIGC创建者大会在上海举行。线性资本创始合伙人兼CEO王淮发表了他的看法:“我们个人感觉这里面创业公司的机会相对小。”王淮表示,“历史上创业公司能够成功很大的原因是你‘为别人所不敢为’,或者做别人认为不会起来、不太看得重的东西,这一类的创业模式我们称之为‘桃花源式的创业’。而大模型需要一些必须成功的要素,要有算力,要有钱;在中国,还必须要有政府支持。”
从王淮等人的介绍来看,大模型的应用前景的确是非常广阔,但并不是所有企业和创业者都可以在这个领域取得成功,特别是中小创业公司。大模型需要大量的数据和计算资源来进行训练和优化,需要有强大的技术团队和丰富的应用场景来支持。对于中小企业和初创公司来说,进入大模型领域会面临很多困难和挑战。
究其原因,从我们前面说过的大模型的特点就可以看出来:
首先,大模型需要消耗大量的计算资源进行训练和优化,需要有足够的资金来支持,作为一个初创企业,就算融资到了独角兽级别,在大模型领域10亿美元这钱也根本不经烧。
其次,大模型的开发和应用需要有一个相对稳定且强大的技术团队和管理团队,需要大把大把很贵且很有经验的人长期来进行调参和优化。对于创业公司,其组织和管理经验往往不是很足,很难长期顺利运行下去这样的项目。
最后,由于大模型的应用场景非常广泛,因此其需要有丰富的数据和场景来进行不断滋养,作为一个没什么用户基础和数据基础的中小公司,很难训练得出来。
因此,对于中小企业和初创公司来说,还是需要谨慎考虑直接进入大模型领域。
04
创业的机会在哪里?
在这个时代,创业公司的机会和大模型的发展非常相似,长期发展一定是技术驱动为主,但在落地的时候对需求的拆解、分析、梳理和把控,也要综合考虑自身的实力和条件,以此来进行探索和发展。
而对于小的创业公司来说,可以考虑以下几方面:
1、基于大模型构建行业模型
正如李彦宏先生所说:“未来所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型,大模型会催生AI原生应用。未来需要用AI原生思维重构所有的产品、服务和工作流程。”
因此,中小企业可以针对不同的行业的特点和需求,在大模型的基础上,针对某个行业进行定制化的开发。比如,医疗、金融、能源等各个行业都有自己的痛点和需求,可以利用垂类大模型的能力来解决这些问题。
2、聚焦小场景
虽然大模型在通用自然语言处理任务上表现出色,但在针对性场景中,大模型性能可能不如专业化的小模型。
举个简单的例子,在语音识别的时候,如果有噪声干扰,或者比较小众地区的方言,通用的语音识别大模型可能就束手无策了,因此,小公司可以聚焦小场景训练小模型,针对特定的语音识别任务,如噪声干扰、不同口音等,以此提高性能,解决用户的具体痛点。
3、给大模型公司提供服务
“淘金“的活动风险高不说,而且还不是谁都能赚到,但是”卖水的生意“却是几乎恒定的稳赚不赔。未来随着行业的井喷,大模型掘金领域的“买水买锅铲”等需求会愈加强烈。因此,创业公司可以不急着构建自己的大模型,转身给大模型公司提供服务也是一个不错的选择,比如以下几个方向:
数据标注:数据标注是机器学习中重要的环节,创业公司可以提供数据标注服务,帮助大模型公司训练更好的模型。
环境部署:创业公司可以提供模型部署服务,帮助大模型公司将模型部署到生产环境中,使其能够更好地为用户提供服务。
监控和分析:所有大模型训练出来之后,都是需要不断更新和优化的,因此创业公司可以提供监控和分析服务,帮助大模型公司监测模型的性能和用户行为,帮助大模型公司优化已经训练好的模型,提高模型的精度和效率。
安全和隐私:未来随着AI应用的泛化,人的信息安全和隐私问题也必会愈来愈受到重视,因此创业公司可以提供安全和隐私服务,帮助大模型公司保护用户的数据和隐私,以便更好地遵守法律法规和保障用户安全。
号主简介
号主介绍:Mr.K,黄哲铿,国内知名IT管理专家,「顿悟山丘」咨询 创始人,科技媒体「技术领导力」创办人。畅销书《技术人修炼之道》《技术管理之巅》作者,曾担任壹药网 技术VP、1号店技术总监、海尔农业电商CTO。分享个体成长、团队管理、企业数字化转型、科技评论。
- END -
关注K哥视频号,看直播讲干货!