作者|Aparna Dhinakaran 编译|Flin 来源|towardsdatascience
部署健壮的、可扩展的机器学习解决方案仍然是一个非常复杂的过程,需要大量的人力参与,并做出很多努力。因此,新产品和服务需要很长时间才能上市,或者在原型状态下就被放弃,从而降低了行业内的对它的兴趣。那么,我们如何才能促进将机器学习模型投入生产的过程呢?
Cortex是一个将机器学习模型部署为生产网络服务的开源平台。它利用强大的AWS生态系统,根据需要部署、监视和扩展与框架无关的模型。其主要特点概括如下:
框架无关:Cortex支持任何python代码;与其他python脚本一样,TensorFlow、PyTorch、scikit-learn、XGBoost都是由该库支持的。
自动缩放:Cortex自动缩放你的api,以处理生产负载。
CPU / GPU支持:使用AWS IaaS作为底层基础架构,Cortex可以在CPU或GPU环境下运行。
Spot实例:Cortex支持EC2 Spot实例来降低成本。
滚动更新:Cortex对模型应用任何更新,没有任何停机时间。
日志流:Cortex使用类似docker的语法将部署模型中的日志保存下来,并将其流式传输到CLI。
预测监测:Cortex监测网络指标并跟踪预测。
最小配置:Cortex部署配置被定义为一个简单的YAML文件。
在本文中,我们使用Cortex将一个图像分类模型作为web服务部署到AWS上。那么,言归正传,让我们来介绍一下Cor