采用机器学习新范式赋能业务的不断探索已经播种了几十年。但随着充足可伸缩算力的就位、海量数据的爆炸、以及机器学习技术的快速进步,各行各业的客户开始对业务进行重塑。最近,像ChatGPT这样的生成式AI应用引起了广泛的关注,引发了诸多想象。我们正处在一个令人激动的转折点上——机器学习被大规模采用,亚马逊云科技也相信生成式AI将会重塑大量客户体验和应用程序。
生成式AI和基础模型
生成式AI是人工智能的一种,能够创造新内容和想法,包括对话、故事、图像、视频和音乐。与所有人工智能技术一样,生成式AI的能力由机器学习模型提供。这些模型是基于大量数据进行预先训练的大模型,通常被称为基础模型(Foundation Models)。机器学习的最新进展(特别是基于transformer的神经网络架构的发明)直接带来这一类模型的爆发式增长,这类模型通常包含数十亿个参数或变量。2019年最大的预训练模型是3.3亿个参数。现在,最大的模型包含的参数超过5千亿个,相当于几年间增加了1600倍。如今的基础模型,例如大型语言模型GPT3.5或BLOOM,以及由Stability AI开发的文生图模型Stable Diffusion,可以执行跨多个领域的多种任务,例如撰写博客文章、生成图像、解决算术问题、对话聊天,基于文档回答问题等。基础模型的规模和面向通用场景的性质使其不同于传统的机器学习模型,后者通常仅执行特定的任务,例如分析文本观点、分类图像和预测趋势等。
基础模型包含大量参数,能够学习复杂的概念,因此可以执行更多任务。通过基于互联网规模的、各种形式和模态的海量数据进行预先训练,基础模型学会在各种语境中应用所习得的知识。尽管预训练基础模型所带来的功能和可能性已足够令人惊叹,而真正让客户为此兴奋不已的是,这些通用模型也可以被定制化加工,执行专属于其业务领域的特定功能,帮助业务建立差异化竞争优势,且与从零开始训练模型相比,仅需使用一小部分数据和计算资源。定制化的基础模型可以带来独有的顾客体验,体现公司的观点、风格和服务,适用于众多消费者行业,如金融银行、旅行和医疗等。例如,一家金融公司如果需要使用所有相关交易自动生成活动日报以供内部流通,它可以使用包括既往报告在内的专有数据来定制模型,以便基础模型了解如何阅读报告和使用哪些数据来生成日报。
基础模型拥有巨大的潜力,但我们仍处在初级阶段。ChatGPT率先吸引了客户对生成式AI的关注。对生成式AI展开研究的人很快意识到,多家公司已经在基础模型上耕耘多年,可用的基础模型也有很多,且各有各的优势和特点。在过去的数年间,亚马逊云科技亲历了技术的快速发展,机器学习的演进也是日新月异。我们期待未来会涌现出全新的体系和架构,而基础模型的多样化会推动新一波的创新浪潮。此前闻所未闻的新应用体验在今天已经成为现实。如何快速利用当今以及未来可能出现的技术,如何快速使用基础模型和生成式AI立刻为公司业务大幅提升生产效率和变革产品与服务。