| 2025 大宝同学对于AI 产业 25点预测,他自嘲道:“做不做 250 不重要,重要的是不违背自己的良知,以及对自身物种的坚信。”😀ps:因大宝的这篇文章基文涉猎太过于广泛,考虑到某些原因,这里小明不得不谨慎的针对某些纯技术问题做出一些comment或Think,并小声明一下大宝的观点预测和思考并不完全与自己相同哈…
正文如下:
一、高置信度预测
1. 不会出现真正的通用人工智能(AGI)
学理与实践依据:
当前大模型(LLMs、Multimodal Foundation Models)在特定任务上表现虽有突破,但仍缺乏自我反省、持续学习以及跨领域的灵活推理等核心 AGI 特征。
学术界对于“具备自主意识及跨领域学习能力的通用 AI”还没有形成成熟可验证的理论与工程路径。
推论:
2025 年内炒作“通用人工智能”将继续,但更多是一种市场及媒体层面的概念包装,实质技术距离“真正通用性”依然甚远。
| 小明的观点补充:
记得在去年初那篇长篇技术文章中【见置顶文章】,在其中的“RL与LLM融合的本质&阐释”章节里,亦提到了对“自主意识”等相关内容,如下引用部分内容作为补充和延展思考🤔:
在本小节中,我们尝试针对「RL与LLM融合的本质&阐释」,洞悉了通过将LLM与RL在「任务构建、目标学习以及在进行监督学习过程中对数据样本分布或重构」等方面的一些内涵关联,并尝试性的提出了「RL与LLM融合探寻AGI」的路径可能以及两者间在底层的本质逻辑,但这里我们对AGI的理解和定义可能仍需要持谨慎的对待和持续探索的态度。
比如回到LLMs的自回归(AR)生成式(Generated)的这一模式,是否能够达到人类处于不同环境所天然具备的主动思考、主动推理甚至是行动上的条件反射?这种主动性是内化在LLMs当中的还是在其之外的?如果是内化在LLMs之中的,那么如何体现或者建模这种主动性行为?
针对主动性/自主性问题,LLM的「自回归(AR)生成式(Generated)的这一模式」在未来是否可采用类diffusing的这种方式或采用跨多层transformer亦或其它的轻巧型框架去捕捉、表征或模拟主动推理中的那种“主动性”,因为“主动”本身的内涵在某种意义上也许也属于推理过程范畴。如果是可能的,那是否可以通过对主动和推理的表征去模拟人类主动推理这一行为模式?ps:加上了“主动”是不是就会出现了另一个「系统三·主动思考」?
2. 无单一系统能系统性解决 Marcus-Brundage(2027)所定义的 4 项或更多跨学科复杂任务
学理与实践依据:
此类任务往往需要多模态感知、符号推理、长期规划及可解释性,且缺乏系统性评测标准。
端到端的深度模型在面对层次化、多步骤、长时程问题时依然存在显著瓶颈。
推论:
即便是最先进的大模型或混合系统,在某些单一任务上可达到甚至超越专业水平,但要高质量跨任务解决多种复杂问题,尚缺乏工程与认知层面的可行路径。
| 小明的观点补充:
我想这里我们也可以从回顾AI的发展历史视角上来看待,如在AI所经历符号主义&链接主义两个学派间的交织下为学术和产业界带来的跌宕起伏,我们会发现在其中过程中并直到今日也终未有效形成AI理论的统一·就像牛顿经典力学那样…也许我们当前AI的发展仍处于“前牛顿时代”(17世纪之前的科学萌芽期),需要在基础理论以及研究方法上做出一些突破。
在这里吕小明之所以有着上述观点,主要是在近几年所阅读过的绝大部分AI领域论文中的观点与结论中,感觉当前人们对AI的研究仍更多偏重于实验性科学,虽然实验的初衷蕴含着研究者们深刻的内涵甚至于内心中已形成某些理论雏形,但我们会发现在这一庞大的研究领域内,仍未出现更合适的数学或其它形式化工具以有效支撑,如在scaling law,深度神经网络DNN的黑盒机制等问题的探索与现状。
不过,22年秋天OpenAI GPT的问世,确实为AI打开了一扇窗,其中tokenize世界下的AR generate也为传统DNN带来了对AI算法与工程上的全新范式甚至是某种对AI认知或使能理念的跃升,再加上如o1这种系统2 test-time认知范式的进一步演进,为更多这一领域的研究者甚至是更多AI技术的使用者带来对AI与认知科学更深刻的理解与运用。
因此,回到大宝同学的上述观点,对于Marcus-Brundage这类复杂任务或问题,也许需要再次经历像22年秋天那样的一次认知突破或范式变革。
3. 纯粹依赖大型生成式模型的公司难以获得显著利润
学理与产业依据:
虽然芯片厂商、云计算提供商在算力需求的持续高涨中受益,但绝大多数依赖大模型输出的初创企业面临研发、算力、数据获取成本和市场不确定性的多重压力。
推论:
真正赚钱的是“卖铲子的人”:高端 GPU、服务器及云服务商。大多数纯粹做模型服务或二次应用的公司在 2025 年仍难以摆脱“烧钱—融资—讲故事”的循环。
4. 美国在 AI 监管层面仍相对缺位,欧洲或成为“全球实践参考”
学理与政策依据:
美国对科技创新的监管通常以市场和行业自律为主;立法和监管速度相对滞后。
欧洲自 GDPR 起在数据与算法监管上一直走在前列,《AI 法规草案》等推动了较为系统化的政策体系。
推论:
更多国家或区域(如亚太一些国家)在制定本地化监管框架时,会部分借鉴欧盟模式;美国大规模、强制性的联邦监管措施在 2025 年内依旧难产。
5. 各类 AI 安全研究机构影响力有限,缺乏真正的强制力
学理与实践依据:
国际或区域性的 AI 安全和伦理研究机构多以发布报告、倡议为主,尚未形成类似金融监管或核不扩散条约般的强制约束体系。
推论:
万一出现安全风险极高的模型或其应用,这些研究机构也只能通过道德呼吁与舆论压力予以干预,很难迅速从法律或执法层面阻止其发布。
6. 生成式 AI 的可靠性问题将持续困扰行业
学理与实践依据:
语言模型的“幻觉”(胡乱编造信息)与逻辑纰漏依然是其结构性特点;大规模数据驱动的黑箱模型难以彻底解决这类失误。
推论:
纵使各大公司不断更新版本,通过在推理链、知识检索、多模态融合等方面做强化,仍无法在 2025 年内彻底根除随机性的错误和不一致。
7. “编造”(Hallucination)现象难以被完全消除
学理与实践依据:
底层训练机制依赖统计相关性,缺乏内在的“事实校准”或系统化知识图谱;即使融入知识库,也要面临知识过时、上下文整合等难题。
推论:
在法律、医疗、金融等高风险场景,大规模部署纯语言模型依然会面临多重挑战,需要专业流程与人工校正。
| 小明的观点补充:
幻觉或编造现象基于现有的AR也好还是diffusion或其他基于统计相关性下的判别及生成模式,我想从理论或工程角度上短期确实均无法完全有效的解决这一问题,也许在与基于符号化或形式化校准与融合的趋势下,可以找到可解路径,但我想符号化或形式化本身面临的当前基础理论瓶颈或发展速度的缓慢与局限也许也会制约着这一路径。
另外,在专有领域下的应用或者场景上进行创新与探索的“中试”,也许能为我们面临当前的局限下找到提效与创新突破口。
8. 高阶推理和复杂逻辑处理依然薄弱
学理与技术原因:
纯神经网络在可解释的推理和多步逻辑方面天生不足,即便通过链式思维(Chain-of-Thought)微调等方法有所改进,依然不具备稳健的跨领域推理能力。
推论:
围绕推理增强、符号推理结合等技术路线会更受学术界与工业界重视,但落地到成熟产品尚需时间。
| 小明的观点补充:
对于类system2·慢思考下的复杂高阶、多步骤逻辑推理的技术发展,是小明非常看好且重点关注的领域,本公号中也有大约30+篇长短不一的文章或笔记对这一领域进行了技术总结与深度思考,从最早期的CoT、ToT、GoT甚至各种*oT的变种框架,再到各种RL融合范式下涌现出的诸如MCTS*、Quiet STaR、SoS、SCoRe、CPO、ReST-MCTS*等范式,再到后test-time时代下衍生出的RFT、Socratic Learning、RevThink、Coconut等创新思想或方法…感兴趣的大伙可以去查看历史文章,有任何问题也非常欢迎大家与我探讨交流~
9. AI“Agents”仍是市场热点,但局限于小范围、特定场景
学理与实践原因:
虽然围绕多步骤任务自动执行的“AI 代理”概念被频频炒作,但实际应用在绝大多数情况下仍依赖人为干预或精细化工程规则。
推论:
更可能出现的是在固定领域(如财务报表分析、游戏对战策略等)中表现优异的专用型代理,但在开放环境中大规模可靠运行的前景尚不明朗。
10. 类人机器人热度不减,但难达“Rosie”级别
学理与工程依据:
机械运动学、实时感知、认知推理等要素在同一个系统中实现统一高度协同仍是极具挑战的工程难题。
推论:
人形机器人或会在运动控制(如双足行走、柔性机械臂控制)上有更炫目的演示,但在日常情境中的任务自主决策与复杂社交交互能力仍远未成熟。
11. OpenAI 等头部企业将继续预告“概念性”产品,落地可能延迟
学理与产业机制:
头部企业往往依靠展示未来技术愿景吸引资本与用户关注,也为后续迭代争取资金与政策支持。
推论:
类似 o3 等产品的早期演示版本和实际商用版本存在功能差异、上线时间延后或价格高企等情况将继续出现。
12. 放射科医生不会大规模被 AI 替代
学理与产业实践:
医疗影像 AI 已在临床筛查与辅助诊断上带来辅助价值,但诊断的责任制与医疗场景的复杂度决定了人类医生的核心地位短期内无法被取代。
推论:
AI 可协助放射科医生提高工作效率或提高某些早期筛查的精度,但主导诊断和决策仍需要人类专业人员。
13. 真正的全自动驾驶仍只在少数城市与特定环境落地
学理与现实验证:
已有的 RoboTaxi 项目显示:自动驾驶在固定、交通环境相对简单或可控的区域尚可维持较好安全性,但面对复杂路况(恶劣天气、特殊交通规则)仍需人工干预。
推论:
2025 年底前在全球范围内,全自动驾驶车辆的应用场景依旧有限且集中在少数地区和城市,行业尚处在“扩张—验证—迭代”的发展阶段。
14. 围绕生成式 AI 的版权纠纷会不断发酵
法律与产业背景:
模型训练需要大量文本、图像等素材,其中包含大量受版权保护的作品;同时,AI 生成的作品性质如何界定也存在法律争议。
推论:
短期内难以达成系统性解决方案,全球各司法体系在类似案例上可能出现判例分化,为行业发展带来更大不确定性。
15. 算力与能耗成为大模型发展的主要瓶颈
学理与产业现实:
大参数量模型在训练和推理阶段的能耗惊人,且随着模型规模呈现指数型增长,这将对企业成本、环境可持续性以及算力资源分配提出严峻挑战。
推论:
企业内部对能耗的披露和优化将成为评估其社会责任与创新能力的重要方面;但 2025 年内大部分公司依旧会对真实能耗讳莫如深。
16. AI 不会大规模替代超过 10% 的人力岗位
劳动力市场现实:
AI 工具更可能提升工作效率、改变工作流程,而非大规模“一刀切”替代人类;创意艺术、配音等领域虽受冲击,但并未出现超过两位数的失业潮。
推论:
尽管部分高重复性、标准化任务会被自动化,但更多岗位将转型为“人机协同”,对 AI 的依赖反而创造了新工作机会(如数据标注、算法监测等)。
二、中等置信度预测
17. 技术“护城河”难以维持,行业或持续趋同
学理与经济学论据:
大模型核心算法已相对成熟,依赖类似的 Transformer 结构、相近的数据集和训练方法;加之开源社区的快速迭代,使得所谓“独家算法壁垒”很快被追平。
推论:
中美头部企业仍处于领先,但欧盟以及其他地区的科研机构、跨国企业,可能在 2025 年前后推出与主流水准相当的模型,全球市场的竞争格局会更为复杂。
18. o3 等高端模型落地受限于高成本与鲁棒性不足
学理与实践依据:
模型规模越大,成本、延迟、推理效率和数据安全等问题越突出。在大规模商业落地时,经济回报与性能/鲁棒性的平衡非常关键。
推论:
以 o3 为代表的新一代大模型或仅在少数领域(如高端企业服务、研究机构)进行早期部署和特定行业微调,难以迅速普及到中小企业与普通消费者。
19. 企业对 AI 的大规模生产级应用仍保持谨慎
学理与管理实践:
关键业务流程通常对安全性、稳定性和可追溯性有极高要求,而生成式 AI 在这些方面尚不够成熟。
推论:
2025 年内,更多企业将 AI 用作辅助或创新试点,而非将其完全替换原有的核心业务系统。
20. AI 公司估值可能出现分化或下行
经济与市场预期:
资本市场对“AI + X”概念目前仍存在一定程度的“非理性繁荣”,但随着实际盈利能力和技术瓶颈被放大,一些缺乏技术与应用落地支撑的公司估值或将回落。
推论:
不排除部分公司估值继续维持或上升,但整体趋势将更多取决于它们能否在关键领域(如企业级服务、国防安全、医疗等)提供真实可持续的盈利模式。
21. Sora、Veo 等在物理推理与环境理解上仍存局限
学理与研发依据:
将大语言模型与物理引擎、世界模型结合是当前研究热点,但在理解物体属性、时序变化和不确定环境中,仍面临许多难点。
推论:
即使 Veo 2 /3 或 Genesis(混合架构)在特定任务上表现更好,也很难在通用场景中实现高可靠度和可解释性,商用化落地需要更长周期。
22. 神经符号混合(Neurosymbolic AI)受到更多重视
学理与发展趋势:
大模型善于模式识别与生成,但在高层逻辑推理、可解释性和因果推理上仍有不足;符号推理则擅长在结构化知识和逻辑演绎上发力。
推论:
工业界和学术界将投入更多资源于神经网络与符号系统的深度融合,以平衡通用性与可解释性。这或成为后续若干年内的重要研发方向。
三、低置信度预测,但值得关注
23. 可能爆发大型网络攻击并大规模利用生成式 AI
学理与安全形势:
攻击者可利用生成式 AI 在自动社会工程、定向钓鱼、舆论操纵及漏洞挖掘等方面实现“批量+定制”式攻击。
推论:
如果此类事件爆发,可能会迅速引发全球对 AI 安全的高度关注,并倒逼更严苛的监管与国际合作。
24. 2025 年内或不会出现“GPT-5 级”跨越式大模型
学理与产业现状:
模型规模扩增的边际收益趋于下降,研究重心逐渐从简单堆量(参数)转向优化结构、提升训练效率和在特定垂直领域的精细化打磨。
推论:
真正具备“量级跃迁”特征的下一代大模型仍需更多新颖算法或架构突破;更多的进展可能出现在专用领域(如生物医药、工业仿真等)。
25. 更多预测与测评平台将出现,学术/产业/监管共治成为趋势
学理与行业机制:
Metaculus、AI Digest 等预测平台对模型能力及营收前景进行跟踪,一方面培养公众与研究者的参与,另一方面也为监管制定与学术研究提供参考。
推论:
随着大模型在金融、医疗、城市管理等关键行业的应用增多,各方将更加关注可解释性、安全性和合规性,行业或在探索“多主体协同治理”模式。
在 2025 年,人工智能领域还将保持高热度和快速迭代,但绝不会一蹴而就地跨越到“通用智能”或大面积替代人类工作的阶段。真正的技术演化需要长周期的积累与多方协同,包括前沿算法的突破、硬件算力的提升、制度与监管的完善,以及对模型可靠性和安全性的深度研究。
无论技术 hype 如何发展,最关键的仍是实际落地:
对于企业而言,如何平衡创新投入与可持续商业回报?
对于社会而言,如何建立合理的监管框架以防范滥用和潜在风险?
对于研究者而言,如何在追求大规模端到端模型的同时,兼顾符号推理或可解释性等需求?
这些问题将在 2025 年持续成为焦点,也将决定未来几年人工智能的健康、可持续发展轨迹。祝各位在这场预测与实践的进程中顺利前行!