GAIDC大会:飞桨邀你来大模型技术与应用论坛

深度学习大规模预训练模型的兴起,以其极强的通用能力和突破性的效果,正推动通用人工智能(AGI)快速发展,并带来了AI研发应用新范式,逐步改变AI生态格局。近期以大规模语言模型为基础的技术工作,展现出大模型更强大的威力和更广阔的应用前景。但同时,大模型也对应着更大的计算量,对训练和推理都带来了新挑战,从AI芯片到AI基础软件,都在针对大模型持续优化,助力大模型技术真正走向产业应用。

2月26日下午,百度飞桨在2023全球人工智能开发者先锋大会(GAIDC)主办“智领未来:大模型技术与应用”论坛。本论坛由百度飞桨和上海市人工智能行业协会主办,NVIDIA、昆仑芯科技和北京智源人工智能研究院协办。将邀请AI大模型领域业内多位知名学者专家,中外AI科技企业大模型研发方向资深工程师,从算法、硬件及AI基础软件等不同视角深入研讨,介绍各领域预训练大模型的最新技术进展,以及大模型开发、训练和部署应用相关的优化和落地经验。

本次论坛都有哪些嘉宾莅临、分享前沿技术?一起来看看吧!

论坛主席

a70a304eb9ab9bc0922e7e50997427bd.png

于佃海

百度飞桨总架构师

个人介绍

百度飞桨(PaddlePaddle)总架构师、集团机器学习平台TOC主席,中国计算机学会(CCF)高级会员。2008年从北京大学毕业后加入百度,长期从事机器学习相关的技术研发、平台建设和产品应用工作,相关成果在广泛业务中发挥了重要影响。曾构建了百度首个大规模分布式机器学习训练系统,最早将机器学习技术引入百度搜索排序,建设了百度最早的机器学习基础算法库和实验平台,是百度深度学习技术最早一批研究人员。参与国家“973计划”、国家重点研发计划和科技创新2030重大项目等多个国家项目课题研究。曾获中国电子学会科技进步一等奖、北京市科学技术进步奖一等奖 、CCF杰出工程师奖。

出席嘉宾

72bcfff293d0f3d398da8045d807e423.jpeg

邱锡鹏

复旦大学计算机学院教授

个人介绍

复旦大学计算机学院教授,担任中国中文信息学会理事、上海市计算机学会自然语言处理专委会主任等,主要研究方向为自然语言处理基础技术和基础模型,发表CCF A/B类论文80余篇,被引用1万余次,获得ACL 2017杰出论文奖(CCF A类)、CCL 2019最佳论文奖、《中国科学:技术科学》2021年度高影响力论文奖,有5篇论文入选ACL/EMNLP等会议的最有影响力论文,主持开发了开源框架FudanNLP和FastNLP,已被国内外数百家单位使用,发布了CPT、BART-Chinese、ElasticBERT等中文预训练模型,在中文模型中下载量排名前列。曾获中国科协青年人才托举工程项目、国家优青项目、科技创新2030“新一代人工智能”重大项目课题等,2020年获第四届上海高校青年教师教学竞赛优等奖,2021年获首届上海市计算机学会教学成果奖一等奖(第一完成人),2022年获钱伟长中文信息处理科学技术奖一等奖(第一完成人)。培养学生多人次获得国家一级学会优博。

演讲主题

ChatGPT能力分析与应用

2022年底,OpenAI公司发布了ChatGPT。ChatGPT可以根据用户输入的指令完成各种语言相关的任务,例如写文章、写代码、回答问题、日常聊天等等,能够极大地提高人们的生产力,这归功于它所表现出的强大的意图理解能力、流畅的对话能力和丰富的世界知识。ChatGPT基于千亿规模参数的大型语言模型。目前,ChatGPT的技术细节及模型参数均未公开,但展现了基于大语言模型研发通用人工智能助手广阔的研究和应用前景。本报告主要围绕ChatGPT介绍大型语言模型的能力评测、能力演化路线分析以及如何在下游任务中更高效利用大模型的能力。

b76af295a76ee3dba88d85cc11eba765.png

伍昱

北京智源人工智能研究院研究员

个人介绍

智源人工智能研究院自然语言和多模态研究负责人及FlagAI飞智开源项目负责人,目前专注于生成模型和多语言多模态模型研究。曾为Facebook AI Research(FAIR)初期成员之一,主导过通用Embedding模型StarSpace、超大规模图模型PyTorch-BigGraph和实体链接模型BLINK等多个深度学习研究项目和相应工程落地。

演讲主题

多语言多模态大模型的发展和应用

近年来,多模态大模型技术飞速发展。语言、视觉模态的融合和对齐,使得多模态大模型在多项任务中取得了惊人的表现,也带来了AIGC在研究和应用层面的爆发。本次报告将介绍多模态预训练大模型发展的几个关键里程碑以及智源研究院在多语言、多模态大模型方向所做的工作。同时也将介绍多模态大模型的典型应用场景。

 

e7658929037ab8d226eeee4b8615d713.png

王井东

百度计算机视觉首席科学家

个人介绍

百度计算机视觉首席科学家,负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前,曾任微软亚洲研究院视觉计算组首席研究员。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络(HRNet)、基于有监督的区域特征融合(DRFI)的显著目标检测、以及基于近邻图的大规模最近邻搜索(NGS,SPTAG)等。他曾担任过许多人工智能会议的领域主席,如 CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他现在是IEEE TPAMI和IJCV的编委会成员,曾是IEEE TMM和IEEE TCSVT编委会成员。因在视觉内容理解和检索领域的杰出贡献,他被遴选为国际电气电子工程师学会和国际模式识别学会会士 (IEEE/IAPR Fellow)、国际计算机协会杰出会员。

演讲主题

百度文心·CV大模型VIMER:算法与应用

本报告将整体介绍百度文心·CV大模型,分享其中的表征预训练算法,包括自监督算法Context Autoencoder、及其基于图文模型引导的推广。最后会介绍预训练算法及CV大模型在百度产品中的应用,包括OCR、工业视觉、度目、自动驾驶数据挖掘等。

c8a1e60a8812385824d795cbb569a73d.jpeg

何径舟

百度深圳自然语言处理部技术总监

个人介绍

百度深圳研发中心自然语言处理部技术总监,国家人工智能专业高级工程师。何径舟毕业于北京大学计算机系,有10年以上人工智能技术研发和管理经验,主要研究领域包括自然语言处理、机器学习、生物计算、智能机器人等,带领团队夺得十余项国际比赛和权威榜单冠军,5 次斩获百度最高奖。何径舟是 200 余项 AI 专利发明人,曾获中国专利优秀奖,受聘中国专利审查技术专家。何径舟也是中国人工智能学会(CAAI)会员,中文信息学会(CIPS)青年工作委员会委员,香港人工智能与机器人学会(HKSAIR)会员,深圳国家高技术产业创新中心专家。

演讲主题

百度文心·文图生成大模型:技术与产品创新

本报告首先介绍跨模态文图生成技术的背景和发展脉络,并带来飞桨文心AI作画大模型ERNIE-ViLG 2.0的技术解读,最后分享AI艺术与创意辅助平台“文心一格”的产品创新。

223857827d708d7519ce1fc423a3a96d.jpeg

吴磊

NVIDIA GPU计算专家团队高级经理

个人介绍

2008年硕士毕业于北京理工大学电子工程系。2011年开始从事基于CUDA的GPU开发工作,有超过十年的GPU加速相关产品研发经验。熟悉历代GPU体系架构,熟悉NVIDIA深度学习生态工具链。在深度学习和大模型的训练加速和推理优化,以及HPC领域在GPU上的加速应用方面有丰富经验。

演讲主题

NVIDIA大模型优化实践与思考

当下,大语言模型(LLM)成为行业内外的焦点。但与此同时,大模型高昂的训练和推理部署成本,带来巨大挑战。作为世界领先的加速计算平台公司,NVIDIA在大语言模型的训练优化和推理优化等方面积累了丰富的经验。本演讲围绕大模型发展趋势和NVIDIA 在大模型训练和推理场景中的实践,分享NVIDIA 对大模型(GPT-3)加速优化的方法及效果,希望能为中国大语言模型的研究和应用落地提供强有力的支持。

1fa09f2029a29dd43807a0c9e82b7971.jpeg

王志鹏

昆仑芯科技互联网行业研发总监

个人介绍

现任昆仑芯科技互联网行业研发总监,原百度资深架构师。硕士毕业于电子科技大学。拥有十余年互联网产品技术研发与管理经验,在云计算和AI芯片行业都有多年规划研发与落地经验。曾主导研发百度云基础IAAS技术体系,支撑并扩展到上万规模。近几年,整体负责自研AI芯片“昆仑芯1代”和“昆仑芯2代”在国内互联网的最大规模部署,产品研发工作覆盖AIGC、大语言模型以及搜索、推荐、商业等广泛AI技术与应用领域。相关工作拥有多篇技术专利。

演讲主题

昆仑芯大模型推理优化与应用实践

大模型对应的模型体积和计算量,给实际产业应用的推理部署带来严峻挑战。昆仑芯基于飞桨框架,针对不同类型的大模型,开展了深度优化,并实现了大规模应用落地。本报告将详细介绍飞桨+昆仑芯对大模型推理的优化加速技术,并分享在百度搜索等大规模业务场景中的应用实践经验。

10e819ca850ba14ad27e83aa8f2d9be1.jpeg

曾锦乐

百度资深工程师

个人介绍

清华大学博士毕业,博士研究课题为机器视觉技术在工业自动化控制中的应用。现任百度资深研发工程师,研究方向涉及深度学习框架基础架构设计、大规模分布式训练技术、推理部署加速、Kubernetes、AutoML等多个领域。曾作为核心成员设计并开发飞桨静态图和动态图基础架构,目前负责大规模分布式训练加速技术,2022年带领团队使用飞桨框架在国际权威AI基准测试榜单MLPerf Training v2.0和v2.1上获得同等GPU配置下训练性能世界第一的成绩。

实操讲解

PaddlePaddle大模型训压推全流程实战

针对大模型开发和应用的挑战,飞桨PaddlePaddle从核心框架到开发平台提供了针对大模型训练、压缩和推理部署全流程的支持。本环节将首先概要介绍飞桨框架在大模型分布式训练和压缩推理上的特色技术。之后将以GPT模型为例,现场演示如何使用飞桨框架从单卡模型扩展出数据并行、Group Sharded、张量模型并行、流水线模型并行等不同分布式并行策略,并依托百度智能云上的飞桨开发平台展示大模型训练、压缩、推理全流程操作。



2023年2月26日13:30-17:00

上海临港中心 一层多功能会议室2

“智领未来:大模型技术与应用”论坛

不见不散!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29198.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能大模型多场景应用原理解析

​强烈推荐一个大神的人工智能的教程:http://www.captainai.net/zhanghan 前言 在上篇文章《人工智能大模型之ChatGPT原理解析》中分享了一些大模型之ChatGPT的核心原理后,收到大量读者的反馈,诸如:在了解了核心原理后想进一步了解未来的发展…

3日行程安排

22号 13:30出发到峡山码头坐船--横山岛景区 峡山码头 船费:来回70r 固定开船时间:9:30,12:00,14:00 或者🈵️12人自动开船,最晚4点有船返回 岛上风景 逛山海“小普陀”寺庙普南禅院,被誉为宁…

托福备考经验心得

综述 托福备考准备经验与心得。全部都是个人的反思,带有个人的观点色彩,按需自取即可。首先是几个深刻的经验教训: 对备考的强度要有一个基本的把握,之前一方面在忙别的事情一方面备考感觉自己成效不是特别明显 (可能是我本人能…

初识托福TOEFL口语

对于想要准备托福的童鞋,并不怎么了解托福考试内容的可以看一看,本文主要给大家分享下托福考试中口语部分介绍。 托福考试中总共有4个部分,第一个部分是Reading(阅读),第二个部分是(Listening&…

chatgpt赋能Python-pycharm自动纠错

Pycharm自动纠错:提高开发效率,减少犯错 随着Python语言的流行,Pycharm成为了众多Python工程师的首选IDE之一。Pycharm具有丰富的功能,其中之一就是自动纠错。本文将介绍Pycharm自动纠错的优点和如何正确使用它来提高开发效率&am…

KFC - VME = 50

KFC - VME 50 CalHeightFromPointToPlane.java_spencer_tseng的博客-CSDN博客

kfc 商家地址获取

简单获取商家地址(kfc) 学习源址 基本的查找url,请求方式我也是在上面的链接中学到的,在此就不赘述了,只是重点分享和记录一下自己遇到的一些bug 代码 import requestsurl http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opkeyw…

java实现kfc点餐系统

一、题目分析 1.1、题目要求 正常餐品结算和找零。基本套餐结算和找零。使用优惠劵购买餐品结算和找零。可在一定时间段参与店内活动(自行设计或参考官网信息)。模拟打印小票的功能(写到文件中)。 基本要求:程序设计风…

html网页肯德基设计代码作业,Illustrator设计一幅肯德基广告单页制作教程

给各位Illustrator软件的使用者们来详细的解析分享一下设计一幅肯德基广告单页的制作教程。 教程分享: 首先来看一下最终效果图: 本幅广告页面我们很常见,就是一幅肯德基广告页面。在现实生活中,同学可以细心观察身边的事物&#…

kfc扫描点餐系统java_Java实现KFC点餐系统过程解析

这篇文章主要为大家详细介绍了java实现KFC点餐系统,模拟肯德基快餐店的收银系统,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 同学们应该都去麦当劳或肯德基吃过快餐吧?请同学们参考肯德基官网的信息模拟肯德基快餐店的收银…

python爬取ajax动态内容肯德基门店,Python爬虫如何爬取KFC地址

随着人们生活水平的提高,肯德基这类的快餐消费的十分火爆,成为小朋友和年轻人的最爱,我们到一个地方想要找到肯德基店面,会根据导航获取肯德基地址,那你知道我们也可以使用python爬虫获取KFC地址吗?我们可以…

爬虫爬取国内肯德基门店信息

预期效果 爬取每个城市(300城市)所有的肯德基门店信息,保存到excel中,效果如下: 代码实现 import requests import csv import jsondef getData(page,key):urlhttp://www.kfc.com.cn/kfccda/ashx/GetStoreList.as…

python爬取肯德基KFC全国门店2021-01-11

python爬取肯德基KFC全国门店 改进版 之前,参考两位网友的代码,爬取全国KFC门店,发现有些许问题。在参考网友代码的基础上,进行改进,最终爬取了全国KFC门店。 思路如下: 第一步:通过KFC门网页…

html网页肯德基设计代码作业,AI快速制作一幅肯德基广告单页教程

这篇AI教程向脚本之家上的朋友介绍AI快速制作一幅肯德基广告单页方法,教程以实例的形式向我们介绍广告单页的制作方法,很实用,也比较简单,喜欢的朋友快来学习一下吧! 首先来看一下最终效果图: 本幅广告页面…

KFC点餐系统

一:要求 同学们应该都去麦当劳或肯德基吃过快餐吧?请同学们参考肯德基官网的信息模拟肯德基快餐店的收银系统,合理使用C/python/Java,结合设计模式(2种以上)至少实现系统的以下功能: 1.正常餐品结算和找零…

KFC门店信息获取 爬虫实战

最近在帮客户做东西时需要用到kfc的门店信息查询数据,在浏览了一圈博客之后,貌似大家都是采用 selenium PhantomJS 这种方式抓取kfc的ajax动态网页, 其实在分析了一波该网站的请求之后,相对来说还是很简单的一个爬虫,该网站甚至没有做浏览器的验证 url http://www.kfc.…

KFC点餐收银

一、问题描述 参考肯德基官网的信息模拟肯德基快餐店的收银系统,合理使用C或Java或Python结合设计模式(2种以上)至少实现系统的以下功能: 1.正常餐品结算和找零。 2.基本套餐结算和找零。 3.使用优惠劵购买餐品结算和找零。 4.可在…

肯德基收银系统

肯德基收银系统 一.题目分析 同学们应该都去麦当劳或肯德基吃过快餐吧?请同学们参考肯德基官网的信息模拟肯德基快餐店的收银系统,合理使用C或Java或Python结合设计模式(2种以上)至少实现系统的以下功能: 1.正常餐品结…

肯德基 服务器响应异常,肯德基链接服务器异常

肯德基链接服务器异常 内容精选 换一换 精简视图提供了云服务器资源概况和状态的可视化统计结果,帮助您直观的了解云服务器资源。在精简视图中,您可以快速获取弹性云服务器基本信息、登录信息、配置信息、监控信息。精简视图提供了云服务器资源概况和状态的可视化统计结果,直…

如何在手机上完成日语翻译中文

如何在手机上完成日语翻译中文?作为从小看《海贼王》、《名侦探柯南》、《火影忍者》等一系列日漫长大的我们,自然有一种想要学习日语的冲动。但是学习一种语言不是一朝一夕就能完成的,虽然小编不能让你瞬间学会日语,但是有一种让…