在刚刚度过的三八妇女节
我们看到了令人振奋的女性力量
在各个行业领域闪闪发亮
给予无数女性力量与鼓舞
在开发领域当然也不例外
亚马逊云科技深度支持并联合 Jina AI
与优秀的女开发者们展开线上对谈
和我们一起来领略她们的
智性魅力与思维碰撞吧
精彩回顾
多模态 AI 技术 Talk 专场
Talk 1
专为多模态 AI 框架而生的数据结构:DocArray
分享嘉宾
杨小燕,DocArray 开源项目贡献者、中国原子能科学研究院在读研究生
GitHub:AnneYang720
演讲内容
▌什么是 DocArray 和神经搜索?
▌如何将现有的多模态数据转化成一个 DocArray 中的 Document ?
▌如何用 DocArray 处理一系列的数据?
▌目前在积极开发的 DocArray 的 Version2 版本。
过去几年 AI 比较专注的任务都是单模态,比如 CV 是图像,NLP 是语言,但是在我们的真实世界中,数据以各种模态存在,如文字、视频、音频等。
神经搜索是借助深度学习跟神经网络的发展,能够在各种各样模态之间的数据去建立联系。有了神经搜索,也就可以在任意模态的数据间进行搜索。
搭建一个多模态应用,第一步往往是对数据进行封装,因为多模态数据往往是非结构化的,所涉及的数据内容非常丰富,只有进行封装后才能保证在整个系统里顺利流转,并作对应处理。
DocArray 是一个用于处理、传输和存储多模态数据的 Python 工具包。DocArray 提供便捷的多模态数据处理功能,具备基于 Protobuf 提供高性能的网络传输性能,同时也为多种向量存储方案提供统一的 API 接口,同时 DocArray 也是 Jina 生态通用的数据结构。
DocArray 为机器学习而生的数据结构:
https://docarray.jina.ai/
Talk 2
AIGC + Jina 多模态框架:感受开源与远程协作
分享嘉宾
赵然,Jina AI 社区开发者,ZMO.AI 算法工程师
GitHub:ruanrz
演讲内容
得益于 Stable Diffusion,AI 绘画从最上游的学术论文,到中游的开源工程的实现,以及下游的产品和创业公司,都得到了很大的促进和繁荣。
赵然分享了在她的开发过程中,最常使用的开源项目:Diffusers 和 Jina,开源的分享和创造力使得这些项目广为人知,并且能够持续的发展。
在实际开发过程中,图像生成只是整个任务流程的一个环节。整个线上服务流程还包括图片的上传、读取、审核、过滤、生成和展示。此外,还包括模型训练和微调。因此,我们需要建立一个算法生成的流水线,以支持完整的服务流程。
由于业务逻辑的复杂性和图像技术的快速迭代,希望功能模块能够像拼积木一样灵活地移动、组合和更换。这样,整个开发流程的效率都能大大提高。这也是 MLOps 的核心思想之一。Jina 就是一个能够去构建多模态 AI 服务和 pipeline 的 MLOps 框架,很轻松地提供服务和扩展,并且还能很方便地部署到生产环境。
Jina 搭建多模态、跨模态应用的 MLOps 框架:get.jina.ai
Talk 3
AI 绘画:技术不止,开源不息
分享嘉宾
曾艳红,上海人工智能实验室 青年研究员
GitHub/Twitter:zengyh1900
演讲内容
曾艳红为我们介绍了 AI 绘画背后的技术及其在这一两年中引起关注的原因。在被戏称 “AI 绘画元年”的2022年,Diffusion Model 这一不同于生成对抗网络的生成模型引发了越来越多的关注。背后有三个原因:
首先,是 Diffusion Model 取得了重大的突破,能够很好地避免在 GAN 模型中存在的模式崩溃问题,使得图像生成的质量取得了突破性的进展。
其次,是多模态预训练大模型的突破性进展,视觉-语言的对应关系使得现有技术能很好地将文本描述转化成图像,进一步解放想象力。
最后也是非常重要的一点就是开源。一方面 Stable Diffusion 模型算法和权重的开源,极大促进了社区的发展。同时,应用部署的开源算法库和一些平台,使得社区训练的权重、应用、prompt 等等都能被快速分享和再创作。
作为个人,想要去了解和学习这些技术,曾艳红认为最好的方式就是参与开源项目。她毕业之后加入了 OpenMMlab 团队,并成为了 MMEditing 的开发维护者。加入一个开源项目,从贡献代码中学习和成长,这是对个人和社区都非常有意义的一件事情。
MMEditing 是一个基于 PyTorch 的开源框架,它支持各种底层视觉算法和多种生成模型,比如,图像/视频超分辨率,抠图,文生图等等。
https://github.com/open-mmlab/mmediting
Talk 4
预训练模型的发展——语言模型通往 AGI 之路
分享嘉宾
潘骁,亚马逊云科技 AI Labs 应用科学家
GitHub:PANXiao1994
演讲内容
潘骁在 Talk 中对 ChatGPT 诞生的历史背景做了详细梳理,同时和大家一起展望了通用智能模型的未来。
人工智能的终极目标是通用人工智能,即 AGI,经历了跨语种、跨任务、跨模态任务这几个阶段。潘骁带领我们梳理了预训练/通用模型发展的历程,并讲解了其中的重要里程碑和代表性事件。
潘骁解释了预训练和通用语言模型的联系和区别。预训练+微调的范式,用无标注的语言模型去训练,在下游任务上进行微调,从共性出发一步步逼近最终的特定任务;而预训练 + Prompting 的范式,不需要人为对任务进行划分,可以支持不同的下游任务。
潘骁介绍了 ChatGPT 的基础模型——Prompting 新范式,理解类和生成类的任务都可以被囊括到 Prompting 新范式,本身自然拥有了跨任务的迁移能力。prompt 也分为手工设计(无需额外训练)、自动学习(需要在下游任务上训练少量参数)两类。
总结来看,预训练-promt 能够达到和预训练-微调相当的效果;模型越大、prompt 的模型效果越好;对任务有泛化能力,few-shot/zero-shot 的能力更强。
最后,潘骁也分享了她的一些思考:
▌所有的 AI 领域问题都是由真实场景需求去推动的,我们研究预训练和通用语言模型的原因是我们关注数据稀缺(成本)和知识迁移(收益)。
▌设计这些语言模型的关键是和目标对齐。
▌Prompting 范式是“通往真正大一统语言模型的关键一步”,因为不需要对任务本身做定义,是一个真正的通用的语言模型。
▌未来趋势:单任务-> 多任务->多模态(走向大一统)
精彩回顾
圆桌对话:打造技术影响力
Q1
简单介绍一下自己以及各自负责的社区。
作为一个技术社区,我们是如何去帮助开发者打造影响力?
郭悦
@亚马逊云科技
大家好,我是亚马逊云科技负责开发者社区的郭悦。我自己是赶上了很多技术的浪潮,让我能够随着机遇一起成长。最早我进入这个行业是从事移动互联网的产品经理;随着移动互联网走向海外,我们公司就是作为开发者去开发安卓和 iOS 生态的项目;第三是人工智能时代的来临,我又回到百度做自动驾驶相关的开源社区运营。
现在我是在亚马逊云科技,我们针对开发者有很多项目,除了能够帮助大家学习之外,还能帮助大家提升自己的技术影响力:比如全球的 User Group 项目,只要你是爱好技术,想学云计算,或者想了解亚马逊云科技相关内容的人,大家都可以找到自己的城市组织去加入到我们的 User Group,我们已在全球400个城市有这样的组织帮助大家学习和成长和分享。到了第二个阶段,如果你已经使用产品或者技术到一定阶段,愿意在社区上分享博客、做 Meetup 的分享,可以申请加入 Community Builder 项目。最高阶的项目是 Hero 项目,我们在全球有200多个技术专家/KOL,希望这些技术领军人物都能帮助大家去传播和分享技术。
官网:
https://dev.amazoncloud.cn/community
安旭
@CCF
我非常欣喜的一件事情就是开源硬件的发展已经成为我们开源发展的重要组成部分,而且也逐渐进入了上升的发展阶段。今年我加入了北京开源芯片研究院,从开芯院的角度为大家推出更多的参与到硬件开源的机会。如果大家对开源芯片有兴趣的话,可以关注我们将在8月份开展的全球峰会。
开芯院:
https://www.bosc.ac.cn/
我的第二个身份是计算机学会开源发展委员会的执委。在学会的平台,我们有一个代码托管工具叫 GitLink,因为我们认为让同学在社区进行代码贡献、智慧共创才是推动开源工作的根本和基础。我这边主要做的是为代码贡献者提供激励机制,给我们的社区运营带来可持续的发展。
GitLink:
https://gitlink.org.cn/
第三是 Linux 基金会。作为国际上耳熟能详的基金会,他们有很好的培训机制、企业生态,也有顶级项目的开发者。他们为项目提供了非常完整的发展机制和资源支撑,对个人也都配备了能力培训、技术交流的机会。
LOFSSA:
https://training.linuxfoundation.cn/
我们为什么要做社区?当你在技术发展过程中遇到困难时,找到一个适合你的组织或开放性的机构,可能会给大家更好地支持。开源以情怀为支撑,技术为支持,智慧共创,社区才能持续发展。
戴雅琦
@OpenMMLab
我是来自 OpenMMLab 社区运营团队的成员,负责活动和生态相关的工作。我们创建于2018年,并在2021年上海人工智能大会上发布了新一代 OpenMMLab,其中包含更多的算法领域和运用场景。目前,OpenMMLab 已经开源了30多个算法库,并且在广泛的用户和开发者中受到了高度关注,覆盖了来自110多个国家和地区的许多顶尖高校和研究机构。
我们非常关注社区中开发者的成长与发展,在讨论技术社区如何帮助开发者打造影响力时,我认为主要有两个方向。
首先,产品本身的技术影响力非常重要。
其次,我们致力于打造社区和交流的氛围,为开发者提供学习和拓展自己技术能力的机会。今年,我们也会开展更多的线下活动,如沙龙和大会,通过参加这些活动,开发者可以拓展自己的人脉和影响力。此外,我们为不同背景的开发者准备了不同的技术小组,并设计了不同的成长路径,让他们可以实现自己的目标。
OpenMMLab:
https://openmmlab.com/
马月昕
@上科大
大家好,我在上海科技大学担任助理教授和博士生导师。我在高校里面做的研究跟企业的研究有共通之处,因为我们所做的一些项目是要服务于现实的应用的。但也有不同,除了考虑现实的应用,高校研究可能会往前更走一步,去做预言性的技术性探索。
首先非常欢迎各地的学生来访问我们课题组并参与讨论,提供足够的经费支持。我本身是做3D视觉、大场景理解和多模态感知,欢迎对研究感兴趣的同学联系我。
我们课题组对于打造影响力有这样几个方式,首先是公开数据集,现在很多 AI 研究都是离不开大模型和数据集的,我们可以关注更加前沿的场景。我们很愿意将数据集公开并且放在更多的开源社区中。
另外,我个人比较建议是主动打破自己的舒适圈,勇于去到不同的领域和机构,或者到不同的文化环境中多做交流,能够帮助你确认自己的发展道路,得到比较好的启发,让自己成为更好的人。
个人主页:
https://yuexinma.me/
Lisa
@Jina AI
就像马老师说的要拓展自己的边界,我们也很开心跟大家公布一个好消息:今年 Jina AI 入选了 Google Summer of Code,我们上线了六个项目,对应会有来自海内外的导师,跟大家去做具体指导,帮助大家成为开源社区的贡献者。对于想要打造自己的技术影响力的同学来说,这也是一个非常好的契机。
我也简单介绍一下我们 Jina AI 的开发者生态。比如说像这次的 Impact Tech, She Can 活动,我们会定期去举办类似的线上交流活动。今年放开之后,我们也会有更多的线下机会,像在上周末我们就在上海举办了 第一个线下的 Office Hours。今年计划能够在北京,上海,广州,深圳,成都等不同的城市,跟开发者进行线下交流;另外我们也会去很积极地参与技术大会,做一些技术性分享。
另外要特别介绍下 Jina AI 的全球社区,我们在全球覆盖了4000多位来自不同国家的活跃开发者,大家都在 Slack 上面使用英语交流和分享自己的项目和观点,通过这样的方式大家既能够提升自己的英文交流能力、也能认识更多的全球开发者。欢迎大家加入!
Q2
为什么会在科技行业从事运营的工作?
你们是如何运营技术社区的呢?
戴雅琦
@OpenMMLab
我一开始在城市和建筑设计领域工作,后来关注到智慧城市从而了解到人工智能并对此非常感兴趣;另外我也喜欢开放的、能够与人交流的工作内容。所以,在一定的学习和积累之后就决定跳出传统的设计领域,来到更前沿的人工智能领域从事相关的运营工作。鼓励一下想尝试新领域的小伙伴,不管是男生还是女生,都希望能够有勇气去探索,过往的经验也都是自己的底气和照明灯。
说回到开源社区运营到底是什么?顾名思义就是维护和开发者之间的链接,从而搭建出一个平等交流、有活力的技术社区。而一个有活力的社区要能给开发者提供交流和学习的机会,让开发者参与到协作中来。社区也需要给有能力、有意愿的开发者提供更大的舞台,让他们参与到项目、社区的发展规划中,一起去搭建符合他们期望的社区。
围绕这两点,我们会展开不同方式的运营动作。首先是通过优质的干货内容输出、有意思有价值的活动以及可落地、可复用的项目案例来不断吸引新用户加入社区;同时也要给已经在社区的用户提供价值认同以及技术成长收获。
Lisa
@Jina AI
我都特别有共鸣,作为一个社区直接的运营负责人,我觉得要有一个平台,要给大家产生这样的连结,可能是人与技术的连结、人与人的连结,以及社区与社区之间的连结。
郭悦
@亚马逊云科技
我其实本身也是产品经理出身,那为什么会转型做开发者社区运营呢?是因为首先我觉得跟技术打交道这件事情很酷,而且技术社区不是把产品推给用户这样一个冷冰冰的事情,而是通过社区建立了你跟用户之间的一种连结。
在亚马逊云科技我们把整个社区叫做 Developer Relations,除了有社区的运营之外,我们还存在大量的布道师、很多好的技术内容和活动,如何更好地传递给开发者?以及如何体现开发者的个人成长、荣誉和价值?也许你要首先做一个社区型的平台网站或者官网,包含社区活动、技术播客、技术演讲。
另外就是团队需要有一些推广经验丰富的人才,比如策划活动、书写技术播客,如何将枯燥的技术内容以更风趣、更幽默的方式传播出去。其实社区运营的工作是对综合能力要求比较高的,大家也不用过多去考虑运营是男生还是女生做。在研发里可能男生是多数派,但在整个科技领域里,做开发者关系的岗位其实女性的占比是非常多的。同样,反而是因为女性研发非常少,那女性可能更有一些少数派的优势,在大舞台进行技术影响力的分享。
我非常鼓励,不管是男生还是女生,遵从内心看一下自己擅长的职业发展方向和自己的爱好。开发者运营,其实是一个非常有趣、非常酷的岗位。
安旭
@CCF
我其实觉得大家不要担心自己是否有技术背景来从事运营的工作。我本身一直在开源领域工作,也想跟大家分享一些实践的感受。开源意味着“开放共享”和“免费”,那么如何让开源项目、开源的创业公司可以长期的、可持续的生存下去,这也是我在开源工作中遇到的痛点和考验。
一句老话“术业有专攻”,技术背景的同学可以把开源项目做得蓬勃发展;如果是学 marketing 或者 business 的同学就可以帮助社区去做两件事情:创新和创富。“创新”是指在技术共享方式上产生的技术进步,“创富”是通过开源能够给技术创新进行持续的造血和支撑,这绝对不是仅仅依靠技术同学就可以做到的。我从来没有为学科限制所苦恼,反而是应该利用自己的优势,跨学科地去学习。
Q3
能否从高校老师的角度给中国学生在全球打造自己技术影响力的经验?
马月昕
@上科大
如果想要进步的话一定要承认自己在某方面是不足的,去向有经验的人请教,一定要放下所谓的面子,以一个更低的姿态、谦逊的态度去做交流。
刚才大家说到自己是非技术背景来做行业的转变,虽然我一直是在做技术,但我的方向也一直在变。我读博前两年做计算几何,那后来转做了多智能体、运动规划,之后又转到了自动驾驶,现在转到了三维感知。转变的过程中也是有焦虑和纠结的,因为你已经在一个领域有了一定积累,转换方向又要重新以小白的身份去面对很多问题,看似你之前积累的东西被丢掉了。但其实我在几次转变的过程中,会发现之前所有的努力或者是在其他领域所积累的解决问题的能力,都是可以迁移到新领域上来的,甚至会很有利于你在新领域的发展。因为你有交叉的背景,只要抱着谦逊的态度,你是可以做到更加出色,甚至做出自己有影响力、更独特的东西。
今天我们这个活动主要围绕女性,最后我想分享的是,就我目前课题组而言,我们招生的比例一般是一比一,我观察下来看男生和女生在技术层面其实没有任何所谓的壁垒,反倒是女生博士会做得更好,因为她们更加关注细节。所以性别不应该成为我们的障碍或恐惧,我们应该打破旧有的框架,给自己一个全新的认知和定位。
听说,点完下面4个按钮
就不会碰到bug了!