1天训完45亿参数大模型!高校计算能力首次比肩科技巨头

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

“第一次,高校拥有了和科技巨头一样的计算能力。”

说这句话的人是中国工程院院士、阿里云创始人王坚。

他口中让高校计算能力倍增的,是复旦大学刚刚发布的云上科研智算平台。

名为CFFF(Computing for the Future at Fudan),由复旦、阿里云、中国电信等共同打造,以公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练。

21c4eac6433c1aab8d394ebd2cabf36b.gif

这是目前国内高校最大的云上科研智算平台——67年前,我国第一架电子计算机(复旦601型电子积分机,1956年)诞生在复旦;67年后,复旦再次走在前列。

目前,首个基于CFFF平台训练的科学大模型成果已经对外正式发布,45亿参数的中短期天气预报大模型可一日训完

组成CFFF平台的两个计算集群,一个名为“近思”一号,一个名为“切问”一号。

两个名字都从复旦校训“博学而笃志,切问而近思”中采撷而来。

发布会上,首届世界科学智能大赛也正式启动,设置5大前沿研究赛道,赛题基于CFFF平台而来,目的是推动科学大模型落地。

CFFF是什么?

CFFF平台,全称Computing for the Future at Fudan。

这个名字被王坚解读为“计算,因为在复旦而创造了未来”。

两个计算集群共同组成了CFFF平台——

一个是面向高精尖研究的专用高性能计算集群“近思”一号,部署部署在复旦江湾校区;

另一个是面向多学科融合创新的AI for Science智能计算集群“切问”一号,托管在1500公里外的内蒙古阿里云乌兰察布数据中心。

两者分隔千里,但同声相应。

addb06b94304686bf129a48774eb3f8b.png

复旦大学浩清教授、人工智能创新与产业研究院院长漆远对CFFF平台做了进一步介绍。

据他讲述,基于百G高速数据传输网、阿里云大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术,两个计算集群练成了一台真正意义上的“超级计算机”。

何以见得?

最直观的表现,复旦大学四校区的所有实验设备都能高速接入CFFF平台,做到异构算力统一管理,计算任务统一调度,满足不同应用场景下的科学智能研究与应用需求。

此外,CFFF平台还拥有国内高校最大规模的多级数据冷热分层存储集群,解决了海量科研数据无法长期备份的痛点,并支持云上高速传输。

举个例子,以往PB级科研数据从复旦校内传到西部数据中心需要两周,如今当天就能完成。

ce8b555f6cf2533b22124f1d8168522e.png

有赖于公共云模式,跑在CFFF平台上的项目可享受到超千卡并行的智能算力,千卡并行的有效算力达到行业领先的92%,可拓展性达到万卡,万卡并行有效算力也可达90%。

同时,CFFF平台可实现年平均PUE小于1.2,每年节省总电力超过2000兆瓦时,年均节碳量达1500吨。

可以说是非常低碳了。

复旦校方透露道,CFFF平台从开始建设的第一天起,就收到来自复旦不同院系的多种研究需求,如生命科学、大气科学、材料科学领域,以及金融系统分析等社会科学研究领域。

平台上的云原生与低代码工程化AI开发平台,进一步降低了AI与科研融合的门槛。

目前,CFFF平台上的第一个科研成果已经诞生,并正式对外发布。

成果是45亿参数量的中短期天气预报大模型,来自复旦人工智能创新与产业研究院李昊团队。

b3fd7832654e478c044bcb865cb4c825.png

在公开数据集上,该模型预测效果首次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了3秒内

而这样一个45亿参数的大模型,在CFFF平台上完成训练,用时只需1天

中国科学院院士、复旦大学校长金力在现场提到:

CFFF设计成了开放的体系,我们非常欢迎产学研创新以及校企合作。但是从另一点来说,CFFF的建立表面上来看是解决算力问题,实际上不完全是。

它还必须解决两件事情,一是“让原来不会用AI工具的人,去用最好的AI工具”,二是“让原来不懂AI的人去懂AI”。

7名院士担任顾问,大赛7月25日开赛

“当前,AIforScience成为热点领域。”金力将CFFF称为复旦推动基础研究范式变革中的关键利器,“AI与科学的融合发展,开拓了科研的新范式。”

CFFF平台启动仪式现场,首届世界科学智能大赛也宣布启动。

195b14272722e218369a4b5f7bf42825.png

从现场获悉,大赛由复旦联合阿里云天池平台、中国电信、中国信通院云大所等举办。

面向全球开放,拟邀请全球五大洲数千支队伍参赛,选手不限国籍年龄,高校、科研机构、企业、个人均可自由组队。

包括金力(生命科学家)、王坚(云计算专家)在内,共有7名院士担任本次大赛的顾问

共设置5大赛道,分别是生命科学、大气科学、材料科学、流体力学、量子化学,赛题基于CFFF平台设计。

218c518d1dbb7c0822a89a3e6600916f.png

其中,生命科学赛道,以生物学年龄评价与老年病风险预测为赛题,通过测量和分析生物体内特定指标或生理过程的状态,评估个体的生理年龄和健康状况。

大赛为参赛者开放了近万样本的个体甲基化数据以及其年龄、性别及老年病患病信息,期望参赛者能够基于甲基化测量对健康个体的年龄给出准确的预测。

材料科学赛道,以MOF材料的预测合成为切入点,探求计算成本更低、更高效、更精确的求解方法。

大赛整理了大量文献等,形成了1500种MOF材料的合成条件数据集,期待参赛选手基于此建立预测模型,准确地预测MOF材料的合成条件。

赛程显示,7月25日大赛初赛开启,9月底,各赛道分批开启复赛。

遴选出的优秀队伍将在11月进行线下答辩,角逐最终名次。

b43a8c30207673910a6f202d7d70e27b.png

大赛设置100万元的奖金池,各赛道冠军奖金10万元。

所有进入复赛的选手都将获得CFFF平台算力免费支持。此外,阿里云也将提供了ML平台PAI的免费试用,及算力产品计算资源。

大赛网站:
https://tianchi.aliyun.com/2023CFFFPrize

大咖云集,锚定新技术,稀土开发者大会主会场直播有奖预约中

2023 年稀土开发者大会主论坛议程出炉!主论坛演讲嘉宾分别是:火山引擎副总裁&字节跳动开源治理运营负责人张鑫、英特尔软件与先进技术事业部研发总监杨继国、Google Cloud 首席架构师于有志、LVS 创始人章文嵩、火山引擎边缘云资深架构师徐广治、北京大学王选计算机研究所教授、CCF 自然语言处理专委会秘书长万小军,他们将聚焦生成式 AI、云原生、边缘云、ChatGPT等热门话题,深入分析新技术给未来产业带来的挑战和机遇。

主会场还将为「掘金引力榜」的获奖项目和个人进行颁奖。点击扫码进入官网,点击直播间,即可参与评论互动与极米投影仪抽奖!

8297321cf7e4a7a03b0f7b32c8e86fa9.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20694.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

介绍一下IEEE PHM2012数据集

ChatGPT: IEEE PHM2012数据集是一个用于轴承剩余寿命预测的公共数据集,由IEEE联合无损检测协会组织。该数据集是通过对一种在机械系统中广泛使用的轴承进行可控实验得到的。 数据集包含四个通道的振动数据和一个温度信号,每个通道的采样率为20kHz&…

2022年天马杯新闻文本扩充生成赛道冠军方案分享

Z Lab数据实验室成员 HeapOverflow 01 前言 去年又摸了一个比赛,这次基本上是自己主导完成大部分建模和优化工作的了。这次能拿下第一,一方面是比赛参加的人比较少(也是因为限制学生参加)来卷的大概也就几十个人,另一方…

百万网友AI导师李沐离职投身大模型,B站“组会”还会有吗?(文末赠书)

目录 1 求学之路:全能学霸2 AI之路:与深度学习结缘3 一战封神:亚马逊首席科学家4 动手学习深度学习 前阵子“沐神”李沐离开亚马逊、加入创业公司BosonAI的消息,引起了业内比较广泛的讨论。 而BosonAI的创始人正好是他的博士生导师…

揭秘 “移动云杯”高校赛道——法律科技创新子赛道

【赛道介绍】 法律科技创新大赛以人工智能、大数据等技术为基础,拓展政法工作现代化中的创新应用,加强科学的方法论和先进的技术手段与传统政法业务的融合,搭建法律科技领域思想、技术、应用的交流实践平台,助推法律科技产业人才培…

资源分享(nlp、kaggle、pytorch、datawhale)

文章目录 一、.机器学习、深度学习库、优秀课程1.1 资源库1.2 优秀课程1.3 优秀作者、公众号 二、NLP相关2.1 NLP相关2.2 transformer资源2.3 Hugging Face:2.4 其它文章 三、CV相关四、数据挖掘4.1 pandas、sns工具类 五、kaggle赛事5.1 NLP赛事 六、 其它赛事&…

chatgpt赋能python:自动填表程序:让烦人的表格填写工作自动化

自动填表程序:让烦人的表格填写工作自动化 随着互联网的发展,填写表格已经成为我们日常生活和工作中不可避免的一部分。不管是在线申请、调查问卷还是财务报表,表格的填写让人感到烦恼而且耗费时间。为了解决填表的烦恼,python的…

chatgpt赋能python:Python如何自动发邮件

Python 如何自动发邮件 Python 是世界上最受欢迎的编程语言之一,Python 可以实现各种各样的功能,自动化发邮件也是其中之一。本文将介绍 Python 的邮件发送库和如何自动发送邮件,希望能为读者提供帮助。 为什么要自动发邮件? 自…

Python某地区二手房房价数据分析

房价数据分析 数据简单清洗 data.csv 数据显示 # 导入模块 import pandas as pd # 导入数据统计模块 import matplotlib # 导入图表模块 import matplotlib.pyplot as plt # 导入绘图模块# 避免中文乱码 matplotlib.rcParams[font.sans-serif] [SimHei] # 设置字体为…

house_price(房价预测)

最近在阅读一些AI项目,写入markdown,持续更新,算是之后也能回想起做法 项目 https://github.com/calssion/Fun_AI Kaggle--House Prices: Advanced Regression Techniques Kaggle address(网址):https://www.kaggle.com/c/house…

kaggle房价预测

通过前面的学习,实战一个房价预测项目,kaggle房价预测,该数据集涵盖了2006-2010年期间亚利桑那州埃姆斯市的房价,包含了很多特征。 导入所需的包 %matplotlib inline import pandas as pd import torch import numpy as np from…

Pandas与ChatGPT的超强结合,爆赞!

来自公众号:数据STUDIO Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。 在人工智能领域,Pandas经常用于机器学习和深…

一个浏览器插件畅享Chat GPT,还有更多实用小组件、高清壁纸

即使chatGPT已经火爆了一段时间了,但它仍然是目前备受关注的话题。而在国内使用需要一定的成本,许多人甚至根本找不到注册的办法,因此也衍生了不少代注册服务。但其实国内也有不少可以体验和chatGPT几乎同样服务的办法,这篇文章就…

docker一键部署网址导航+博客+管理系统(强势开源)

花森门户 码云仓库地址:https://gitee.com/HuaSenJioJio/huasenjio-compose Github仓库地址:https://github.com/huasenjio/huasenjio-compose 📌 关于 花森系列网站增添新作品,(huasenjio-compose)官方仓…

【LLMs】关于LLMs的语义搜索

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

AI_Papers:第一期

2023.02.06—2023.02.12 文摘词云 Top Papers Subjects: cs.CL 1.Multimodal Chain-of-Thought Reasoning in Language Models 标题:语言模型中的多模式思维链推理 作者:Zhuosheng Zhang, Aston Zhang, Mu Li, Hai Zhao, George Karypis, Alex Sm…

基于ChatGPT用AI实现自然对话

1.概述 ChatGPT是当前自然语言处理领域的重要进展之一,通过预训练和微调的方式,ChatGPT可以生成高质量的文本,可应用于多种场景,如智能客服、聊天机器人、语音助手等。本文将详细介绍ChatGPT的原理、实战演练和流程图&#xff0c…

怎样用一周时间研究 ChatGPT

我是怎样用一周时间研究 ChatGPT 的? 上周大概开了 20 多个会,其中有一些是见了觉得今年可能会比较活跃出手的机构,其余见的绝大多数是和 ChatGPT 相关。 我后面就以 ChatGPT 为例,讲下我是如何快速一周 cover 一个赛道的&#x…

走进机器学习

作者简介:本人是一名大二学生,就读于人工智能专业,学习过c,c,java,python,Mysql等编程知识,现在致力于学习人工智能方面的知识,感谢CSDN让我们相遇,我也会致力…

Spring 20年:缔造Java领域神话,近90% Java程序员形影不离

题图 | Image by Freepik 摘要:在编程世界,代码耦合性高、复杂性大的问题一直折磨着所有开发人员。为了解决这个问题,程序员前仆后继开发出了各种框架。但是没有一个特别能打、且让大部分程序员拍手称快的框架诞生。直到有一位年轻但经验丰富…

程序员的三大优点:懒惰、急躁和傲慢

1987 年的今天,Perl 1.0 发布。 今天是 Perl 语言诞生 35 周年。 忽略一下这张图的时间 Perl 语言发明人 Larry Wall 是一位传奇的黑客、一个风趣幽默的人。他的传世名言—— 程序员的三大优点是:懒惰、急躁和傲慢。 在编程圈子的普及程度大概仅次于——…