在上一篇笔记「上交大全华班复现o1旅程式学习下的深思考」中,其中对于上交大提出的旅程学习即system2慢思考认知范式下对于“多步骤的隐式到显式空间状态映射下的细粒度联合概率分布建模”的描述隐喻为“社会心理学或社会经济学两种不同的长程动态系统慢演化现象”。
同时,在这篇笔记中进一步尝试提出“泛化”、“探索”、“奖励”等这些关键要素在其中所隐含的联系与意义,即“前向式探索”与“反向式奖励”可能是建立当前可泛化空间中泛化间联系并实现泛化空间延展的一种灵活且高效的动态方法。
我们知道,对于现实世界中某些复杂的长链推理模式的联合表征分布的泛化性很难被传统模型所学习,这其中可能受到来自现实世界中可采集的数据样本量、模型结构与目标函数数学变换及模式复杂度本身等多方面的挑战。
因此结合我之前几篇关于模型扩散思想的观点阐释,以及近期来自哈佛等欧美多所名校的学者在机器学习和生物学的融合研究中,所揭示的“扩散模型与进化算法”的观点,很自然的与上述所提及的社会心理学或社会经济学的“动态演化”联系在一起。
在研究中,学者们提出了扩散与进化即同一枚硬币的两面的观点,并进一步阐了扩散/进化算法对于复杂任务场景的意义与潜在内涵,诸如:
传统算法在复杂的高维空间中容易过早收敛于单个解。如协方差矩阵适应进化策略CMA-ES在复杂场景时往往会陷入局部最优状态,这导致探索多种可行最优状态的限制,无法保持有效解决多模式优化任务所需的多样性。
而扩散进化算法以独特的方式将扩散模型的迭代去噪步骤与自然选择过程集成在一起,通过将高维参数空间映射到低维潜变量空间,可更高效搜索,识别同一搜索空间内的多个不同解。
同时,潜变量空间扩散有助于克服传统方法的缓慢收敛和局部最优问题,从而实现更快的收敛和解的更多样性。
通过扩散进化方法引入潜变量空间,可以为高维复杂参数进化任务找到最优解,同时显著减少计算量..
也许,未来对于像扩散与进化现象那样,进一步将跨学科思想引入或借鉴到AI领域将会是一个趋势,即未来各学科领域的快速发展不仅受益于AI4S,同样也会给AI的发展带来S2AI。
对这方面感兴趣的大伙可参考我之前相关笔记并希望与大伙深入讨论:
- 残差神经网络中的扩散机制:理论及应用
- Meta的Transfusion:自回归与扩散的融合
- 慢思考复杂推理下AR与Diffusion的融合统一
- 自回归(AR)与扩散(Diffusion)的邂逅
by 吕明