前阵子,大模型赛道非常热闹,360、字节、KIMI、知乎等公司纷纷召开发布会,推出自己独具特色的新产品,一时间引发市场的不少想象和讨论。在看似百花齐放、万紫千红的同时,K哥也观察到了一些不好的迹象,这些“迹象”如果不受到重视,或者不被好好解决,甚至有可能对整个行业的发展带来很大的不利影响。今天就跟大家分享一些K哥的个人看法。
01
搞浏览器的做AI,搞AI的做浏览器
最近,KIMI悄悄推出了浏览器插件,将其在AI上的深厚功力赋能到了这一插件上,主打一个“随时提问”和“快速总结”。据不少用户反馈,KIMI的这款浏览器插件,确实给他们带来了不错的使用体验。这让K哥想起了年初360公司推出的AI搜索。这款被360定位为“新一代答案引擎”的AI工具,在帮助360“破圈”AI的同时,也吸引了更多新用户,赢得不少好口碑。搞浏览器的做起了AI,搞AI的玩起了浏览器!为什么大家都不按牌理出牌,纷纷玩起了跨界?不是这个世界太疯狂,而是大家心中的“欲望”太膨胀。
360之所以跨界,是因为360公司深耕互联网多年,拥有海量的用户数据。通过AI技术,360不仅可以更深入地挖掘这些数据的价值,还能够与原有的安全业务形成互补,增强用户体验。而且,360还可以从更高的战略角度出发,以此在未来的AI战局中布点卡位。
而KIMI作为AI领域的独角兽,为啥插手浏览器?原因同样很简单,KIMI是想通过浏览器插件的方式落地AI应用,让KIMI快速触达大量用户,在短时间内积累用户数据和反馈,在将AI功能与用户的网络行为紧密结合的同时,帮助KIMI构建更加完善的业务生态,进一步拓展其在内容推荐、智能搜索等领域的应用。
道理都是明摆着的,无外乎用户、数据、业务闭环一类的商业因素。在商言商,这样的逻辑并没错,但K哥想说的是,各路玩家在考虑自身利益的同时,也要适当考虑整个行业生态的构建。如果企业过分“执着”于在所有领域都能自成一体,把所有用户都圈定锁死,不给别人“插手染指”的机会,最后可能适得其反,既分散了自身资源,又陷入创新不足的困境。
当年,微软就曾试图打造一个能够一手遮天的封闭生态系统,将 Windows 操作系统、Office 软件、浏览器等产品捆绑在一起,试图控制用户的所有网络行为,不给任何对手留下见缝插针的机会。然而,随着互联网的快速发展,微软的封闭策略还是没能成功,最终被更加开放、更有创新能力的 Google 和苹果所超越。
跨界破圈并非易事,需要付出巨大的成本和精力;人造闭环也并非长久之计,还容易陷入“内卷”的泥潭。K哥认为,也许专注、开放才是这个时代应有的王道。当前AI生态中的各个“节点”,应该更多地专注于自身的核心技术,并将其开放给更多开发者和用户,这样才能形成更良性的循环和更健康的发展。
02
把AI当搜索引擎用
李开复曾在接受腾讯科技采访时表示,很多用户在把AI当成“搜索引擎”用,是不对的。一方面,如果让AI回答天气、地名等常规问题,它未必会比传统的搜索引擎更好,而且还可能出现“幻觉”错误;另一方面,AI很多强大的功能不被开发,而仅仅被视作搜索引擎,是一种严重的“大材小用”。
之所以出现上述现象,一个重要原因是大众对AI的认知存在很大局限性。就像当大家看到AI的使用页面“很像”常见的搜索引擎,就自然而然地把它当成了搜索工具。而没有深入了解AI不仅仅是某一形态的工具,更是一种能够模拟人类智能的技术,具有超强的学习和适应的能力,其背后蕴藏着无限的应用潜力。
当然,大众对AI除了有认知层面的问题,还存在“使用能力”方面的问题,比如用户提问的能力,AI时代,一个人提问的能力(prompt engineering),甚至远比给出答案的能力更重要。这种能力,同样是时代发展、市场教育中所不可或缺的重要一环。
另外,对于AI,大家还要做好正确合理的“期望管理”。不应将AI过去神化,认为它无所不能、给出的答案都是准确的。而是应该清醒地认识到,AI仍在发展、进化的过程中,虽然可以成为我们工作生活中的有效辅助和帮手,但仍然存在很多缺陷和不足,既不能完全替代人类的思考,也远不能满足大众的全面需求。正确的认知、利用这一技术,才会让我们更客观地对待各种AI工具,把它们放在合适的位置上,既不大材小用、浪费资源,也不盲目迷信,失去应有的判断。
03
拿用户数据,训练自家的模型
数据资产被认为是AI时代最重要的资产,但随着生成式AI的快速发展,互联网上的那些普通数据已经快被翻个底朝天了,以至于新鲜、有价值的数据越来越稀缺,因此某些平台开始盯上了自家用户生成的内容。
最近,马斯克旗下的xAI公司正经历这样的风波。社交平台X的用户发现,他们在该平台上发的帖子,正在被平台拿来训练它的聊天机器人Grok 。在此之前,X平台没有发布任何正式公告或通知,就偷偷上线了一个默认用户允许将其帖子用于AI训练的不公平协议。更能证明X“阴险”的是,这一条款的入口隐藏极深,而且即使找到,手机端也无法关掉,必须用电脑版才行。
类似的事件并不是孤例,比如,近期番茄小说通知平台作者,签“同意将其作品投喂AI”的条款;Meta公司强迫用户同意将个人数据用于AI训练,否则就禁止使用其旗下的Facebook 和Instagram等产品,等等。K哥认为,这样的事件如果没有合适的处置模式,很可能会影响AI下一步的发展。
首先,这种行为侵犯隐私,违背法律法规。许多国家和地区都已经制定了严格的数据保护法规,要求企业在处理个人数据时必须获得用户的明确同意。违反规定不仅会导致企业面临巨额罚款,也会损害企业的声誉和形象。
其次,从商业角度来看,用户信任是企业最宝贵的资产。一旦用户对企业的数据处理方式产生怀疑,他们可能会选择不再使用该企业的产品或服务,甚至可能引发大众对整个AI行业的信任危机。
另外,从技术发展的角度来看,依赖未经同意的数据,可能会因为数据收集过程不透明,或用户有意无意提供一些误导性信息,从而导致模型的泛化能力出现问题,影响模型的可靠性和准确性。
04
不重视底层大模型的研发
自ChatGPT引发生成式AI热潮,席卷全球以来,中美两国无疑成了站在潮头浪尖上的领导者。但在发展路径上,我们和美国却做出了不同的选择。以OpenAI、谷歌、Meta为代表的美国同行,持续在底层大模型上发力。而我们的业界却认为:中国发展大模型不能跟美国“打篮球赛”,随着他们“满场乱飞”,而应当使用“下围棋”的方法,在技术相对落后的情况下,通过大模型赋能各个产业领域,以实现AI在应用上的突破和提升。红衣教主周鸿祎就曾大声疾呼:不要迷信底层大模型,不要学硅谷。事实上我们也确实没有学硅谷,而是开始了侧重于场景应用的行业大模型的探索之路。有数据统计,截至今年5月,国内市场已先后推出300多个大模型。技术路线上也衍生出了CoE 、MoE等不同的“流派”。
大家都明白,新时代下的AI竞争,注定是一场旷日持久的马拉松,作为其中的参与者,必然要面临“生存,还是伟大”的选择。做底层大模型研发,无疑是“伟大”但又门槛极高的事。拿OpenAI来说,为了搞研发,它每年的亏损竟高达50亿,这显然是一般的AI玩家所承受不起的。所以国内的很多AI企业,才会选择以应用作为进场的切入点,并时时刻刻、心心念念惦记着“商业化”和“变现模式”。
单纯从商业的角度看,这样做并没什么不对,但我们也不能忘记另外一个客观现实:我们很多的行业大模型、各种AI应用,其实是在底层大模型的基础上,在开源技术普及、各种预训练技术和框架工具等壁垒被打破后的前提下构建起来的。相较之下,需要耗费巨大算力资源和多样化的数据支持、深厚的技术支撑的底层大模型研发,才更具创新性和核心竞争力。举个例子,一个投入大量成本、基于GPT-4研发的医疗或金融行业的应用,可能会随着GPT-5或更高级迭代的出现,变得笨拙不堪甚至毫无使用价值。底层大模型的每次迭代,都可以将花费大量心血的各种“上层工具”,摧枯拉朽般毁灭,而这可能也是Open AI、Meta等巨头即使年年巨亏,也要狂砸底层大模型的深层原因。
比尔.盖茨有一句名言:“我们总是高估在一年或者两年中能够做到的,而低估五年或十年中能够做到的。”这句话放在大模型研发上非常合适,掌握了底层大模型,才真正掌握了主动权。近日,Meta发布被称为“世界上功能最强大的公开基础模型”Llama 3.1 405B,也说明底层大模型的竞赛,远远没有结束,我们依然任重道远。
05
开源 or 闭源,根本不是关键
李彦宏在某次访谈中大谈开源大模型、闭源模型的差别,并直言“开源大模型是智商税”。为此傅盛还进行了隔空反驳,认为开源和闭源模型是相互竞争、共同发展的关系,不应一方压倒另一方,还说闭源大模型才是真正的“智商税”。两位大佬的口水战,引起不少媒体和网友的讨论。在K哥看来,开源闭源并不重要,底层大模型研发结合应用场景拓展,才是AI发展之路的关键。
如同K哥上面所说,底层大模型是AI技术发展的基石,它在某种程度上决定了AI发展的方向和各种可能性,同时也为AI应用提供了强大的计算能力和算法支持,使得各种智能应用成为可能。而应用场景则是AI技术落地的关键所在,将底层大模型的技术与特定行业的专业知识和数据相结合,可以解决金融、医疗、教育等特定领域的复杂问题和挑战,更好地提高企业资源分配和利用效率,实现真正意义上的“AI生产力”和实实在在的降本增效。我们的业内人士,应该少一些“本位主义”的口水之争,多一些务实和专注,才是AI发展所真正需要的。大家先齐心协力、共襄盛举,一起让行业枝繁叶茂,把蛋糕真正做大,然后“一荣俱荣”不也挺好吗?
阿里云创始人王坚曾说过:“人工智能有一个非常长的过去,但是有一个非常短的历史。长到什么时候呢?长到其实你可以追溯到一百多年以前。但是短到什么时候呢?短到就是 GPT 的出来。”无论来时路是长是短,是顺畅还是艰辛,如今的AI和大模型都在快速发展的路上,希望它们的未来之路能顺顺利利,一路繁花。
如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓