国产大模型市场遇冷:挑战与机遇并存,一般人学大模型,我劝你算了吧

前阵子,大模型赛道非常热闹,360、字节、KIMI、知乎等公司纷纷召开发布会,推出自己独具特色的新产品,一时间引发市场的不少想象和讨论。在看似百花齐放、万紫千红的同时,K哥也观察到了一些不好的迹象,这些“迹象”如果不受到重视,或者不被好好解决,甚至有可能对整个行业的发展带来很大的不利影响。今天就跟大家分享一些K哥的个人看法。


01

搞浏览器的做AI,搞AI的做浏览器

最近,KIMI悄悄推出了浏览器插件,将其在AI上的深厚功力赋能到了这一插件上,主打一个“随时提问”和“快速总结”。据不少用户反馈,KIMI的这款浏览器插件,确实给他们带来了不错的使用体验。这让K哥想起了年初360公司推出的AI搜索。这款被360定位为“新一代答案引擎”的AI工具,在帮助360“破圈”AI的同时,也吸引了更多新用户,赢得不少好口碑。搞浏览器的做起了AI,搞AI的玩起了浏览器!为什么大家都不按牌理出牌,纷纷玩起了跨界?不是这个世界太疯狂,而是大家心中的“欲望”太膨胀。

360之所以跨界,是因为360公司深耕互联网多年,拥有海量的用户数据。通过AI技术,360不仅可以更深入地挖掘这些数据的价值,还能够与原有的安全业务形成互补,增强用户体验。而且,360还可以从更高的战略角度出发,以此在未来的AI战局中布点卡位。

而KIMI作为AI领域的独角兽,为啥插手浏览器?原因同样很简单,KIMI是想通过浏览器插件的方式落地AI应用,让KIMI快速触达大量用户,在短时间内积累用户数据和反馈,在将AI功能与用户的网络行为紧密结合的同时,帮助KIMI构建更加完善的业务生态,进一步拓展其在内容推荐、智能搜索等领域的应用。

道理都是明摆着的,无外乎用户、数据、业务闭环一类的商业因素。在商言商,这样的逻辑并没错,但K哥想说的是,各路玩家在考虑自身利益的同时,也要适当考虑整个行业生态的构建。如果企业过分“执着”于在所有领域都能自成一体,把所有用户都圈定锁死,不给别人“插手染指”的机会,最后可能适得其反,既分散了自身资源,又陷入创新不足的困境。

当年,微软就曾试图打造一个能够一手遮天的封闭生态系统,将 Windows 操作系统、Office 软件、浏览器等产品捆绑在一起,试图控制用户的所有网络行为,不给任何对手留下见缝插针的机会。然而,随着互联网的快速发展,微软的封闭策略还是没能成功,最终被更加开放、更有创新能力的 Google 和苹果所超越。

跨界破圈并非易事,需要付出巨大的成本和精力;人造闭环也并非长久之计,还容易陷入“内卷”的泥潭。K哥认为,也许专注、开放才是这个时代应有的王道。当前AI生态中的各个“节点”,应该更多地专注于自身的核心技术,并将其开放给更多开发者和用户,这样才能形成更良性的循环和更健康的发展。


02

把AI当搜索引擎用

李开复曾在接受腾讯科技采访时表示,很多用户在把AI当成“搜索引擎”用,是不对的。一方面,如果让AI回答天气、地名等常规问题,它未必会比传统的搜索引擎更好,而且还可能出现“幻觉”错误;另一方面,AI很多强大的功能不被开发,而仅仅被视作搜索引擎,是一种严重的“大材小用”。

之所以出现上述现象,一个重要原因是大众对AI的认知存在很大局限性。就像当大家看到AI的使用页面“很像”常见的搜索引擎,就自然而然地把它当成了搜索工具。而没有深入了解AI不仅仅是某一形态的工具,更是一种能够模拟人类智能的技术,具有超强的学习和适应的能力,其背后蕴藏着无限的应用潜力。

当然,大众对AI除了有认知层面的问题,还存在“使用能力”方面的问题,比如用户提问的能力,AI时代,一个人提问的能力(prompt engineering),甚至远比给出答案的能力更重要。这种能力,同样是时代发展、市场教育中所不可或缺的重要一环。

另外,对于AI,大家还要做好正确合理的“期望管理”。不应将AI过去神化,认为它无所不能、给出的答案都是准确的。而是应该清醒地认识到,AI仍在发展、进化的过程中,虽然可以成为我们工作生活中的有效辅助和帮手,但仍然存在很多缺陷和不足,既不能完全替代人类的思考,也远不能满足大众的全面需求。正确的认知、利用这一技术,才会让我们更客观地对待各种AI工具,把它们放在合适的位置上,既不大材小用、浪费资源,也不盲目迷信,失去应有的判断。


03

拿用户数据,训练自家的模型

数据资产被认为是AI时代最重要的资产,但随着生成式AI的快速发展,互联网上的那些普通数据已经快被翻个底朝天了,以至于新鲜、有价值的数据越来越稀缺,因此某些平台开始盯上了自家用户生成的内容。

最近,马斯克旗下的xAI公司正经历这样的风波。社交平台X的用户发现,他们在该平台上发的帖子,正在被平台拿来训练它的聊天机器人Grok 。在此之前,X平台没有发布任何正式公告或通知,就偷偷上线了一个默认用户允许将其帖子用于AI训练的不公平协议。更能证明X“阴险”的是,这一条款的入口隐藏极深,而且即使找到,手机端也无法关掉,必须用电脑版才行。

类似的事件并不是孤例,比如,近期番茄小说通知平台作者,签“同意将其作品投喂AI”的条款;Meta公司强迫用户同意将个人数据用于AI训练,否则就禁止使用其旗下的Facebook 和Instagram等产品,等等。K哥认为,这样的事件如果没有合适的处置模式,很可能会影响AI下一步的发展。

首先,这种行为侵犯隐私,违背法律法规。许多国家和地区都已经制定了严格的数据保护法规,要求企业在处理个人数据时必须获得用户的明确同意。违反规定不仅会导致企业面临巨额罚款,也会损害企业的声誉和形象。

其次,从商业角度来看,用户信任是企业最宝贵的资产。一旦用户对企业的数据处理方式产生怀疑,他们可能会选择不再使用该企业的产品或服务,甚至可能引发大众对整个AI行业的信任危机。

另外,从技术发展的角度来看,依赖未经同意的数据,可能会因为数据收集过程不透明,或用户有意无意提供一些误导性信息,从而导致模型的泛化能力出现问题,影响模型的可靠性和准确性。


04

不重视底层大模型的研发

自ChatGPT引发生成式AI热潮,席卷全球以来,中美两国无疑成了站在潮头浪尖上的领导者。但在发展路径上,我们和美国却做出了不同的选择。以OpenAI、谷歌、Meta为代表的美国同行,持续在底层大模型上发力。而我们的业界却认为:中国发展大模型不能跟美国“打篮球赛”,随着他们“满场乱飞”,而应当使用“下围棋”的方法,在技术相对落后的情况下,通过大模型赋能各个产业领域,以实现AI在应用上的突破和提升。红衣教主周鸿祎就曾大声疾呼:不要迷信底层大模型,不要学硅谷。事实上我们也确实没有学硅谷,而是开始了侧重于场景应用的行业大模型的探索之路。有数据统计,截至今年5月,国内市场已先后推出300多个大模型。技术路线上也衍生出了CoE 、MoE等不同的“流派”。

大家都明白,新时代下的AI竞争,注定是一场旷日持久的马拉松,作为其中的参与者,必然要面临“生存,还是伟大”的选择。做底层大模型研发,无疑是“伟大”但又门槛极高的事。拿OpenAI来说,为了搞研发,它每年的亏损竟高达50亿,这显然是一般的AI玩家所承受不起的。所以国内的很多AI企业,才会选择以应用作为进场的切入点,并时时刻刻、心心念念惦记着“商业化”和“变现模式”。

单纯从商业的角度看,这样做并没什么不对,但我们也不能忘记另外一个客观现实:我们很多的行业大模型、各种AI应用,其实是在底层大模型的基础上,在开源技术普及、各种预训练技术和框架工具等壁垒被打破后的前提下构建起来的。相较之下,需要耗费巨大算力资源和多样化的数据支持、深厚的技术支撑的底层大模型研发,才更具创新性和核心竞争力。举个例子,一个投入大量成本、基于GPT-4研发的医疗或金融行业的应用,可能会随着GPT-5或更高级迭代的出现,变得笨拙不堪甚至毫无使用价值。底层大模型的每次迭代,都可以将花费大量心血的各种“上层工具”,摧枯拉朽般毁灭,而这可能也是Open AI、Meta等巨头即使年年巨亏,也要狂砸底层大模型的深层原因。

比尔.盖茨有一句名言:“我们总是高估在一年或者两年中能够做到的,而低估五年或十年中能够做到的。”这句话放在大模型研发上非常合适,掌握了底层大模型,才真正掌握了主动权。近日,Meta发布被称为“世界上功能最强大的公开基础模型”Llama 3.1 405B,也说明底层大模型的竞赛,远远没有结束,我们依然任重道远。


05

开源 or 闭源,根本不是关键

李彦宏在某次访谈中大谈开源大模型、闭源模型的差别,并直言“开源大模型是智商税”。为此傅盛还进行了隔空反驳,认为开源和闭源模型是相互竞争、共同发展的关系,不应一方压倒另一方,还说闭源大模型才是真正的“智商税”。两位大佬的口水战,引起不少媒体和网友的讨论。在K哥看来,开源闭源并不重要,底层大模型研发结合应用场景拓展,才是AI发展之路的关键。

如同K哥上面所说,底层大模型是AI技术发展的基石,它在某种程度上决定了AI发展的方向和各种可能性,同时也为AI应用提供了强大的计算能力和算法支持,使得各种智能应用成为可能。而应用场景则是AI技术落地的关键所在,将底层大模型的技术与特定行业的专业知识和数据相结合,可以解决金融、医疗、教育等特定领域的复杂问题和挑战,更好地提高企业资源分配和利用效率,实现真正意义上的“AI生产力”和实实在在的降本增效。我们的业内人士,应该少一些“本位主义”的口水之争,多一些务实和专注,才是AI发展所真正需要的。大家先齐心协力、共襄盛举,一起让行业枝繁叶茂,把蛋糕真正做大,然后“一荣俱荣”不也挺好吗?

阿里云创始人王坚曾说过:“人工智能有一个非常长的过去,但是有一个非常短的历史。长到什么时候呢?长到其实你可以追溯到一百多年以前。但是短到什么时候呢?短到就是 GPT 的出来。”无论来时路是长是短,是顺畅还是艰辛,如今的AI和大模型都在快速发展的路上,希望它们的未来之路能顺顺利利,一路繁花。

在这里插入图片描述

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/397485.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【软件测试】功能测试理论基础

目录 项目的测试流程🏴 需求评审 评审形式 测试人员在需求评审中职责 测试计划与方案 测试计划 问题 测试方案🏴 测试计划与方案的对比 功能测试设计🏴 测试设计的步骤 项目的测试流程🏴 作用: 有序有效开展…

力扣Hot100-994腐烂的橘子

中等 在给定的 m x n 网格 grid 中,每个单元格可以有以下三个值之一: 值 0 代表空单元格;值 1 代表新鲜橘子;值 2 代表腐烂的橘子。 每分钟,腐烂的橘子 周围 4 个方向上相邻 的新鲜橘子都会腐烂。 返回 直到单元格…

MiniCPM-V: A GPT-4V Level MLLM on Your Phone 手机上的 GPT-4V 级多模态大模型

GitHub - OpenBMB/MiniCPM-V: MiniCPM-V 2.6: A GPT-4V Level MLLM for Single Image, Multi Image and Video on Your Phone 2408.01800 (arxiv.org) 目录 Introduction Model Architecture Training End-side Deployment MiniCPM-V是一种高效的多模态大型语言模型&…

cad文字转arcgis注记

cad中文字转为arcgis注记,步骤如下: 1、将dwg文件下annotation文件加到图层中 2、文件点击右键,转换地理数据库注记 3、 导入默认地理数据库中,或自己新建地理数据库,起个文件名、点确定(注意&#xff1a…

手机CPU性能天梯图(2024年8月),含安兔兔/GB6/3DMark跑分

原文地址(高清无水印原图/持续更新/含榜单出处链接): 2024年8月手机处理器天梯图 2024年8月1日更新日志:由于近期并未有新处理器发布,故只做常规更新;移除鲁大师天梯图;补充其它天梯图数量。 -…

Leetcode - 周赛409

目录 一,3242. 设计相邻元素求和服务 二,3243. 新增道路查询后的最短距离 I 三,3244. 新增道路查询后的最短距离 II 四,3245. 交替组 III 一,3242. 设计相邻元素求和服务 本题纯模拟,代码如下&#xff…

工业三防平板助力MES系统打造工厂移动式生产管理

随着工业4.0时代的到来,智能制造、数字化车间等概念层出不穷,生产过程的可视化管理也成为了企业提升效率、优化生产的关键。而工业三防平板,凭借其坚固耐用、功能强大、便携易用等特性,成为了实现生产过程可视化管理的重要利器&am…

服务器网络磁盘挂载

一、Ping测试 先测试磁盘网络的连通性 例如:这里申请的网络磁盘是: 127.0.0.1:/shareData ping 127.0.0.1二、挂载 确认连通后,确定需要挂载的目录,这里服务器的挂载目录为:/data/share (自主选择创建目录…

1985-2023年中国城市统计年鉴(PDF+EXCEL)

1985-2023年中国城市统计年鉴 1、时间:1985-2023年 2、格式:1985-2023年PDF版本,1993-2023年excel格式 3、说明:中国城市统计年鉴收录了全国各级城市社会经济发展等方面的主要统计数据,数据来源于各城市的相关部门。…

算法3:二分查找(下)

文章目录 寻找峰值寻找旋转数组最小值 寻找峰值 class Solution { public:int findPeakElement(vector<int>& nums) {int left 0, right nums.size() - 1;while(left < right){int mid left (right - left) / 2;if(nums[mid] < nums[mid 1])left mid 1;…

漏洞复现-F5 BIG-IP 存在远程代码执行漏洞 (CVE-2023-46747)

1.漏洞描述 F5 Networks是全球范围内应用交付网络&#xff08;ADN&#xff09;领域的知名厂商&#xff0c;致力于帮助全球大型企业和服务提供商实现虚拟化、云计算和灵活的IT业务服务。。 F5 BIG-IP 存在远程代码执行漏洞。未经身份验证的攻击者可能会绕过配置实用程序身份验…

大话设计模式:七大设计原则

目录 一、单一职责原则&#xff08;‌Single Responsibility Principle, SRP&#xff09;‌ 二、开放封闭原则&#xff08;‌Open-Closed Principle, OCP&#xff09; 三、依赖倒置原则&#xff08;‌Dependency Inversion Principle, DIP&#xff09; 四、里氏替换原则&am…

Java事务失效

目录 传送门一、概念1、事务的传播类型2、isolation3、Transactionnal注解属性 二、事务失效场景1、异常捕获2、异步处理3、final修饰事务方法4、非public5、T范围小了6、不加T或者事务传播用了NOT_SUPPORTED这种不支持事务7、数据库MyISAM不支持事务8、事务方法未被Spring管理…

Unity URP 曲面细分学习笔记

学百人时遇到了曲面着色器的内容&#xff0c;有点糊里糊涂&#xff0c;于是上知乎找到了两篇大佬的文章 Unity URP 曲面细分 和 Unity曲面细分笔记&#xff0c;本文只是自己做学习记录使用 1.曲面细分与镶嵌 曲面细分或细分曲面&#xff08;Subdivision surface&#xff09;是…

字节跳动发Seed-TTS语音合成模型,可模仿任意人的声音,效果逼真

前期我们介绍过很多语音合成的模型&#xff0c;比如ChatTTS&#xff0c;微软语音合成大模型等&#xff0c;随着大模型的不断进步&#xff0c;其合成的声音基本跟真人没有多大的区别。本期介绍的是字节跳动自家发布的语音合成模型Seed-TTS。 Seed-TTS 推理包含四个功能模块&…

无人机之热成像篇

一、定义 无人机热成像技术是指将热成像相机安装在无人机云台上&#xff0c;通过无人机的高空飞行能力和云台的稳定性&#xff0c;结合红外热成像技术对目标区域进行非接触式的温度测量和图像采集。该技术利用物体发出的红外辐射来生成图像&#xff0c;通过测量物体表面温度分布…

Leetcode JAVA刷刷站(8)字符串转换整数

一、题目概述 二、思路方向 要实现这个功能&#xff0c;我们可以遵循以下步骤来编写 myAtoi 函数&#xff1a; 去除前导空格&#xff1a;使用循环或字符串的 trim() 方法&#xff08;虽然直接操作字符串更高效的方式是使用循环&#xff09;。检查符号&#xff1a;记录第一个非…

nodejs 生成随机邮箱

首先安装依赖&#xff1a; npm install faker 示例代码&#xff1a; const faker require(faker); const fs require(node:fs) function generateRandomEmail(num){let str for (let i 0; i < num; i) {str faker.internet.email() &:focus:&;}fs.writeFil…

魔众文库系统v7.0.0版本推荐店铺功能,管理菜单逻辑优化

推荐店铺功能&#xff0c;管理菜单逻辑优化 [新功能] RandomImageProvider 逻辑升级重构&#xff0c;支持更丰富的随机图片生成 [新功能] 资源篮订单参数字段 [新功能] 首页推荐店铺功能&#xff0c;需要在后台 文库系统 → 文库店铺 开启推荐 [系统优化] Grid 快捷编辑请求…

告别DockerHub 镜像下载难题:掌握高效下载策略,畅享无缝开发体验

告别DockerHub 镜像下载难题:掌握高效下载策略,畅享无缝开发体验 1. 介绍 1.1 DockerHub简介 Docker Hub 是 Docker 提供的一项服务,用于与您的团队查找和共享容器映像。 它是世界上最大的容器映像存储库,其中包含一系列内容源,包括容器社区开发人员,开源项目和独立软…