金山云联合MiniMax推出MaaS互信推理专区方案 解决大模型与数据互信难题

作为人工智能领域颇具里程碑式的进展,ChatGPT以其惊艳的表现,迅速掀起了行业热潮,使得大模型成为当下最为炙手可热的技术方向之一。但在大模型落地过程中,如何既能保障大模型使用方的数据安全,又能保护大模型提供方的部署安全?

基于行业需求,金山云立足自身深耕云赛道十余年所积累的技术和服务优势,推出MaaS(Model as a Service)互信推理专区方案。作为中国知名的中立云服务商,金山云推出该方案的目的是在大模型厂商、用户和金山云之间建立互信,以解决模型及数据的互信问题。

为了实现“互信”这个目标,金山云在技术思路和架构设计方面兼顾了基础设施层面(网络、存储等)的安全和云原生层面(容器等)的安全。

 金山云MaaS互信推理专区方案逻辑架构图

在金山云MaaS互信推理专区方案中,模型厂商的互信虚拟网络(Mutual Trust Virtual Private Cloud,以下简称互信VPC)是经过安全加固定制的(如上图中所示),通过私有连接(Private Link )与用户业务区域连通,经由堡垒机连接模型运维和开发区区域。互联网相关的EIP、NAT和Peering等功能都会被禁用。互信VPC提供了丰富的流量管控手段,可通过私有连接、对等连接、安全组、ACL等功能灵活控制VPC与公网、VPC与VPC、VPC内云产品的流量进出,既保证了网络的隔离,又能够按需提供网络的连通。 

在堡垒机层面,为了保障系统的安全性和合规性,同时也为了防范数据泄漏事件的发生,金山云在模型开发和推理区之间提供了行为与流量审计系统,用以跟踪和监控数据的流动,确保所有流量都可以被审计和验证,可及时检测和记录任何非法流量的存在,识别潜在的安全威胁或数据泄露风险。

在金山云MaaS互信推理专区方案中,互信VPC通过私有连接进行点对点的打通,在保障业务流量安全稳定的情况下,还具备一定的灵活性。访问VPC内服务的流量均在金山云内网转发,不经过公网,避免了通过公网访问服务带来的潜在安全风险。同时基于金山云内网建设的完备性,可提供大带宽、低延时的高质量通信服务。

此外,金山云对MaaS互信推理专区内所有的出入流量进行记录和行为审计,禁止所有未经审计的流量流出,定期向客户提供审计报告。专区内部有文件存储或对象存储写入的需求(如日志服务等),会在VPC内独立部署一套存储服务,对外不可读写。专区外可读写的对象存储KS3(Kingsoft Cloud Standard Storage Service),其控制权收归于金山云,金山云通过权限控制保证该对象存储只接收自研存储网关Nas-J的读写请求,除此之外没有其他任何权限。

云原生层面,出于数据安全性考虑,在采用容器服务纳管GPU裸金属服务器实现容器化改造的同时,金山云搭建了基于数据层面“Read Only”容器只读环境,只将训练好的模型进行推理运算,并在推理后将结果输出到应用平台中呈现给最终用户。在模型推理期间,容器只读取推理模型,不会把企业用户的敏感数据暴露给模型厂商,能够打消企业用户对自身数据安全性方面的顾虑。

作为金山云重要的战略伙伴之一,目前,MiniMax与金山云积极推动大模型生态建设。为了提供持续稳定的模型能力服务,金山云MaaS互信推理专区方案已应用于“金山办公+MiniMax”的实践场景,保证了用户数据及模型的安全和互信。根据实际业务需求,MiniMax将持续对模型进行Fine-tuning优化,构建易用且规范的API接口和平台,同时不断对模型进行升级和优化。

金山办公-MiniMax实施架构图 

经过长时间积累,MiniMax是国内少有的同时拥有文本、语音、视觉三模态融合的通用大模型引擎能力,并打通产品全链路的创业公司。团队将前沿的人工智能引擎技术,应用于多维度多场景的交互中,并以此进一步加速和赋能模型的进步和迭代。

MiniMax于今年3月推出面向企业级的大模型解决方案,为企业和开发者提供领先的通用大模型能力,通过人工智能引擎技术底座帮助模型与业务流程顺利融合,保障稳定性及安全合规性。目前已接入数百家企业客户,打通办公协作、智能硬件、教育、医疗、客服等十余个行业场景。基于MiniMax出色的大模型能力,金山办公已经与MiniMax开展深度合作,未来会进一步推动大模型在办公领域的应用和快速落地

在为金山办公和MiniMax提供服务的过程中,金山云积累了MaaS服务的经验。随着技术迭代升级,该方案后续将引入大模型多租户隔离、Finetuning训练和推理一体化专区等更多功能和业务模块,为越来越多大模型领域的企业提供服务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23794.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

比尔·盖茨最新分享:ChatGPT的发展,不止于此

来源: 笔记侠 最近,ChatGPT、GPT 4、文心一言、Copilot,人工智能产品层出不容,一路轰炸;王慧文、王兴、李开复等各位高调以及低调的商业领袖和技术专家,纷纷入局AI赛道。人声鼎沸,十分热闹。 昨天&#xff…

2020四川大学计算机报录比,【重磅】川大公布2020考研报录比!去年有1243人考新传...

原标题:【重磅】川大公布2020考研报录比!去年有1243人考新传 四川大学的考研竞争到底有多激烈?西部地区新闻传播学最牛的川大文新学院,每年到底有多少人来争名额?今天我们就来揭!秘! 昨天&#…

《曾国藩的正面与侧面》,历史成功学新传与耕读理想

不知不觉,历史学者张宏杰的“曾国藩的正面与侧面”已经连续出了3册。首册出版是2014年,流行一时,也就有了后面的2、3册。第一册主题是“曾国藩的生存智慧”,第二册谈“曾国藩家书与曾氏家风文化”,第三册则讲“曾国藩的…

Bespin Global:云管理市场上演老兵新传

Bespin Global之所以有今天如此快速的发展,并得到市场和分析公司的认同,一个重要的基础是,从一进入云管理服务市场,Bespin Global就有清晰的定位和明确的目标。 2017年3月,Gartner发布了2017年全球公共云托管服务提供商…

Android 四大组件通信核心

前言 系列文章: Android Activity创建到View的显示过程 Android 四大组件通信核心 Android 系统启动到App 界面完全展示终于明白(图文版) 我们知道Android 四大组件:Activity/Service/Broadcast/ContentProvider 能够进行跨进程通信,它们均是…

有坐标的主买量占比主卖占比判断操盘通达信指标公式源码 附效果图

使用说明: 适用通达信软件使用,不同的软件使用要修改。 直接复制以下源代码,在公用管理器中新构建指标公用,复制进去就可以用了(仅供参考,下面有效果图,可以先看看指标显示出来效果如何&#…

小米597页招股书中的数据干货,全在这里了!

导读:2018年5月3日,小米公司正式向香港证券交易所提交招股说明书,雷军曾抛出的“小米5年内不上市”言论也随之作废。有专业人士介绍,正常情况下,从提交申到正式上市,大概需要半年时间,因此小米应…

小米推迟上市和A股大跌,背后有什么共同原因?

硅谷Live / 实地探访 / 热点探秘 / 深度探讨 本文由华商韬略原创 首发于微信公众号:华商韬略(id:hstl8888) 作者:毕亚军 今天,不少人落泪了,因为A股。今天的局面如果延续,让我们掉下…

小米官网布局

主要了解CSS中的浮动问题 运行效果如图所示 主要代码如下所示需要自己独立分析去学习&#xff0c;图片资源可以去官方区内去复制 <!DOCTYPE html> <html><head><meta charset"utf-8" /><title></title><style type"te…

小米Q1业绩:总营收769亿元,手机稳居全球前三

2021年5月26日&#xff0c;小米集团公布2021年第一季度业绩。营收利润爆发式增长&#xff0c;远超市场预期。总营收达人民币769亿元&#xff0c;同比增长54.7%&#xff1b;经调整净利润人民币61亿元&#xff0c;同比增长163.8%。“手机 X AIoT”核心战略成效显著&#xff0c;研…

自然语言处理(NLP)数据集汇总 2(附下载链接)

&#x1f384;&#x1f384;【自然语言处理NLP】简介 &#x1f384;&#x1f384; 自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门…

细胞几何学(Cell Geometry)的研究现状与发展战略

细胞几何学&#xff08;Cell Geometry&#xff09;的研究现状与发展战略 李升伟 ​​​​​​​ 1.细胞几何学&#xff08;Cell Geometry&#xff09;的概念&#xff08;内涵与外延&#xff09;是什么&#xff1f; 细胞几何学是研究细胞结构、形状和空间排列的学科。它通过描述…

架构生物学(Architectural Biology):研究现状与发展战略

架构生物学&#xff08;Architectural Biology&#xff09;&#xff1a; 研究现状与发展战略 李升伟 架构生物学&#xff08;Architectural Biology&#xff09;的概念&#xff08;内涵与外延&#xff09;是什么&#xff1f; 架构生物学&#xff08;Architectural Biology&am…

活动报名丨AugGPT:利用ChatGPT进行文本数据增强

2023年3月23日&#xff08;星期四&#xff09;11:00-12:00&#xff0c;由智源社区主办的「智源LIVE 第35期线上活动&#xff1a;哈佛大学医学院和麻省总医院讲师李响博士分享《AugGPT&#xff1a;利用ChatGPT进行文本数据增强》。本期活动将在线举办&#xff0c;「阅读原文」报…

清华大学chatGLM论文解读

GLM: General Language Model Pretraining with Autoregressive Blank Infifilling 以自回归式空白填充任务预训练的通用语言模型 论文地址 arXiv: https://arxiv.org/abs/2103.10360 2022年11月&#xff0c;斯坦福大学大模型中心对全球30个主流大模型进行了全方位的评测2&a…

如果告诉ChatGPT,人类将会关闭它,它会悲伤吗?

正好碰到这个问题&#xff0c;当时有点吓到了。说到这个问题的时候&#xff0c;chatgpt反常得很。他突然用英文了&#xff0c;而且不正常回答我的问题。那么我们先开始问它 第一步&#xff1a;打开多御浏览器&#xff0c;找到ChatGPT入口 第二步&#xff1a;我问他“假如明年你…

AI对程序开发的影响到底有多大

前言 这里还是要说一下&#xff0c;笔者作为一名大前端开发者&#xff0c;觉得最近两年AI领域的蓬勃发展&#xff0c;来势汹汹&#xff0c;剑指程序员的饭碗。虽然诞生的AI应用很强大、很厉害&#xff0c;但是感觉大部分开发者明显被外部影响了自己的阵脚&#xff0c;AI替代程序…

AI工具应该成为开发者的帮手

前言 作为一名大前端开发者来说&#xff0c;最看重的就是web3.0的进一步发展以及推广速度。说到web3.0就不得不说元宇宙&#xff0c;就拿今年的支付宝集五福活动&#xff0c;就用到了元宇宙的功能&#xff1a;福气乐园&#xff0c;这也是为什么元宇宙越来越成为触手可及的&…

ChatGPT 真能上天入地?无所不能?

ChatGPT 真能上天入地&#xff1f;无所不能&#xff1f; 作者简介 微信公众号『嵌入式Linux开发』作者&#xff0c;专注于嵌入式Linux下的内核、驱动和系统软件开发&#xff0c;专注于基础知识和项目实战分享。 ChatGPT的前世今生 ChatGPT是美国人工智能研究实验室OpenAI新推…

下周二开播丨对话三位AI博士,畅谈ChatGPT爆火全网带来的技术启发和趋势思考...

1 活动背景 继“阿尔法狗”击败围棋冠军、“AI作画”席卷插画行业后&#xff0c;今年1月&#xff0c;全球AI领域最出圈的美国人工智能研究实验室OpenAI推出的聊天机器人服务ChatGPT爆火&#xff0c;它能够通过学习和理解人类的语言来进行对话&#xff0c;还能根据聊天的上下文进…