AGI的目标是实现人类般的通用智能,这意味着AI可以像人类一样理解任意通用任务,并以人类的智力水平执行完成。基本上,除了自我意识的生成,AGI就是人类对人工智能的终极梦想了。在AGI曙光照进现实之际,云知声化身为那位站在新风口、乘风破浪的先锋,一路勇往直前,不断探索创新,投身于大模型的研发与应用,打通大模型新范式。
人工智能的进化演进
无论是近一年来火爆的AI绘画,还是当红的ChatGPT,AI研究应用的终极目标,都是向着AGI通用人工智能的大一统目标在迈进。从最初人工智能诞生到如今,人工智能的进化演进可以简单地分为三个阶段:规则引擎、机器学习和深度学习。
在规则引擎阶段,AI系统基于既定的规则来模拟人类思维过程。这种方法通常应用于专业领域,如医疗诊断、安全控制等。
在机器学习阶段,AI系统开始通过训练数据来学习和改进自己。这种方法需要大量的标注数据和特征工程,而且对于新问题需要重新设计算法。
在深度学习阶段,AI系统通过多层神经网络来获取更高级别的抽象特征,从而实现更加精确的预测和分类。这种方法不仅可以解决传统机器学习中的一些难题,还能够进行端到端的学习和优化。深度学习确实为人工智能的发展带来了很大的推动力,但它并没有改变AI的范式。深度学习依然是一种基于规则和数据的统计学习方法,其目的是通过从数据中提取特征和模式来提高机器的性能。而ChatGPT的出现,则代表着自然语言处理技术的突破。ChatGPT不仅可以模拟人类对话,还可以根据输入的上下文生成连贯的回答,这标志着人工智能开始向更加智能化、可理解性更强的方向发展。
云知声打通大模型新范式
在ChatGPT推出后,云知声已开始训练模型,开启了新的“数据动力学范式”。云知声认为:大模型需要从数据规模、质量和模型调教下手,才能真正解决问题,“大力”只是“必要不充分条件”。按照公司的规划,技术升级将分两步推进:先在六七百亿参数提升优质数据规模,再扩大到千亿级参数提升大模型效果。
之所以要分两步走,这与技术实现和商业落地相关。按照业内的实践,在优质数据规模足够大情况下,模型越大效果越好,但训练成本也越高。从六七百亿参数起步,是因为从业内成果分析看,只有参数规模达到五六百亿以上,模型才可能出现“智能涌现”。今年不只是要做好大模型,还要考虑产业实际应用的成本和部署等因素。云知声认为,大模型训练成功后,以目前的算力成本,可能需要把大模型参数量通过蒸馏技术压缩10倍才能满足实时性和规模化应用要求,这要视具体应用场景而定。云知声在做BERT模型时,就积累了丰富的经验,通过模型蒸馏提速近百倍,而实际性能损失很小。
在落地行业上,物联和医疗是两个优先的行业,此前他们在这两个领域投入和积累最多。但两个行业的侧重点并不一样。物联行业本质上是提升交互能力,当大模型技术升级以后,人机对话就不会“聊死了”,不过,这些是通用场景,拓展应用场景“广度”。
在科技浪潮中,云知声这个拥有十一年创业历程的企业,如同站在风口上的一位选手。正当新时代的篮球比赛进入紧张的中场时刻,一个站在球门附近的球员突然接到了一记精准传球。云知声作为人工智能独角兽企业,迅速作出反应稳定地接住了传球,并以无与伦比的速度向前推进。