谷歌AI绘画4大牛携手创业,天使估值7个亿

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

最近的谷歌像个大漏勺,这不,又有AIGC核心成员联手跑路咯!

量子位独家获悉,这回跟谷歌say byebye的,是文生图核心团队——AI绘画模型Imagen论文的四位核心作者,出走目的是要搞自己的AI公司。虽然公司名称暂未对外公布,但新公司将一以贯之的路线是很清楚的:

以Imagen为基础,沿着原来的项目做下去,不仅继续做文生图,还要做视频方向

核心人才创业,自然少不了VC塞钱——已经按1亿美元的惊人天使估值完成了首轮融资,而且更多VC想给钱而赶不上、投不进。

75f8351a115b021028f47cb5e81bdf9f.jpeg

这也算是文生图、文生视频、AIGC赛道上,最知名的研究团队之一了。

文生图骨干成员共创AIGC新公司

新公司联创四人,Chitwan Saharia、William Chan、Jonathan Ho以及Mohammad Norouzi,都出自谷歌。

他们之前精力重点放在AIGC的文生图板块,是谷歌用来对抗DALLE-2的大杀器Imagen的论文共同作者,位置都挺重要的那种。

6fcb23e8dc7b2d75045d8a3902033e0d.png

先来介绍一下Chitwan Saharia,也是Imagen的共同一作。

a5d4e48856f2ca2c6da5fd96035f53f6.png

Chitwan本科毕业于孟买理工学院计算机科学与工程专业,在孟买理工学院和蒙特利尔大学都当过程序和算法方面的研究助理。2019年加入谷歌,base多伦多,花了3年时间从二级软件工程师做到高级研究科学家,去年12月从谷歌离职。

Chitwan有语音识别、机器翻译的经验,在谷歌工作时,主要负责领导image-to-image扩散模型的工作。

第二位William Chan,也是Imagen论文共同一作。他同样出身计算机工程,先后就读于加拿大滑铁卢大学、卡内基梅隆大学,中间在新加坡国立大学当过1年交换生。

a9ca72570700f8111c20fe57fee3e48e.png

在卡内基梅隆大学拿下博士学位后,William还在加拿大最大的社区学院之一乔治布朗学院,主攻烘焙和烹饪(?),学了3年。

Willian从2012年起加入谷歌,于2016年成为谷歌大脑的一份子,去年5月离职时,他已经是谷歌大脑多伦多的研究科学家了。

然后要介绍的是Jonathan Ho,UC伯克利博士毕业。

他不仅是Imagen论文的core contribution,还是Diffusion Model奠基之作《Denoising Diffusion Probabilistic Models》的一作

4d86d686237a52843ba8d2b55e44bf33.png

博士毕业于UC伯克利计算机科学专业的Jonathan,之前在OpenAI当过1年的研究科学家,后来在2019年加入谷歌,共工作了2年零8个月,去年11月以研究科学家的身份从谷歌离职。

新公司的最后一位联创叫Mohammad Norouzi,也是Imagen论文的共同一作。

88320b936be4bd863a50fd4ee22c9e75.jpeg
Mohammad Norouzi

他在多伦多大学计算机科学博士就读期间,拿到了谷歌ML博士奖学金。毕业后他加入谷歌大脑,在那儿工作了7年,在谷歌的最后title是高级研究科学家,工作重点是生成模型。

同时,Mohammad也是谷歌神经机器翻译团队的原始成员,SimCLR的联合发明人。他在GitHub主页上小小地透露了自己的最近动态:

目前,我在一家初创公司工作,公司使命是推进人工智能的发展水平,帮助人类提高创造力。
我们正在招聘!

这句话以外,关于新公司的更多信息,四人在任何社交平台都没有更详细的透露。

这已经是谷歌最近漏出去的第n波人了。

就拿刚刚过去的2个月来说,先是包括顾世翔(Shane Gu,‘让我们一步一步地思考’研究者)在内的至少4名谷歌大脑成员加入OpenAI;情人节时,Hyung Won Chung和CoT最早的一作Jason Wei携手组团叛逃OpenAI。

本周三,您猜怎么着?嘿,又跑了一个:

2aeab04b673038a12fb115ea05740663.png

OpenAI狂喜,只有谷歌大漏勺本勺受伤的世界诞生了。

Imagen是什么?

了解完谷歌漏走的这四个人,回头来说说为他们职业生涯赢得掌声的Imagen项目。

Imagen是谷歌发布的文生图模型,发布时间在DALL-E 2新鲜出炉一个月以后。

本文开头放的熊猫震惊表情包,就是朝Imagen输入“一只非常快乐的毛茸熊猫打扮成了在厨房里做面团的厨师的高对比度画像,他身后的墙上还有一幅画了鲜花的画”后,得出的一张要素完备的AI生成画作。

(不好意思,请自行断句)

5fc60bc66c6025bd6a45d7deec1f8e17.png

在Imagen出现之前,文生图都共用一个套路,那就是CLIP负责从文本特征映射到图像特征,然后指导一个GAN或Diffusion Model生成图像。

Imagen不走寻常路,开辟了text-to-image新范式

纯语言模型只负责编码文本特征,具体text-to-image的工作,被Imagen丢给了图像生成模型。

具体来讲,Imagen包含一个冻结的语言模型T5-XXL(谷歌自家出品),当作文本编码器。T5-XXL的C4训练集包含800GB的纯文本语料,在文本理解能力上比CLIP强不少,因为后者只用有限图文对训练。

图像生成部分则用了一系列扩散模型,先生成低分辨率图像,再逐级超采样。

c9c48311241613f0853354c5d0ee86fa.png

依赖于新的采样技术,Imagen允许使用大的引导权重,所以不会像原有工作一样使样本质量下降。这么一来,图像具有更高的保真度,并且能更好地完成图像-文本对齐。

概念说起来简单,但Imagen的效果还是令人大为震撼的。

生成的狗子飙车技术一流:

0e2e6b89ddd4cf316580d8e6226af1f6.png

比起爆火的DALLE-2,Imagen能更准确地理解同时出现两个颜色要求的情况:

99764b710d782cb40d7f1077ef857b09.png

一边绘画一边写字这种要求,Imagen也成功完成,不仅写得对,还能加光影魔术手般的烟花特效(不是)。

c105cad64f0ee9823e43b5849d0a5afa.png

以及对后来研究更有帮助的是,谷歌通过Imagen的研究,优化了扩散模型。

首先,增加无分类器引导(classifier-free guidance)的权重可以改善图文对齐,同时却会损害图像保真度。

为了解决这个bug,在每一步采样时引入动态阈值(dynamic thresholding)这个新的新的扩散采样技术,来防止过饱和。

01c4448486d5c97ffe7e93d3f5f804b1.png

第二,使用高引导权重的同时在低分辨率图像上增加噪声,可以改善扩散模型多样性不足的问题。

第三,对扩散模型的经典结构U-Net做了改进,变成了Efficient U-Net。后者改善了内存使用效率、收敛速度和推理时间。

后来在Imagen上微调,谷歌还推出了能“指哪打哪”版本的文生图模型DreamBooth。只需上传3-5张指定物体的照片,再用文字描述想要生成的背景、动作或表情,就能让指定物体“闪现”到你想要的场景中。

比如酱婶儿的:

15306eb84c4b6cc555d9740df8e62333.png

又或者酱婶儿的:

620f9e649af0f24f5b846eed1c223d2e.png

大概是Imagen效果太过出色,劈柴哥后来亲自宣发的谷歌AI生成视频选手大将,就叫做“Imagen Video”,能生成1280*768分辨率、每秒24帧的视频片段。

啊,等等,谷歌有Imagen Vedio,这和四人的新公司不是撞方向了吗?

仔细看了下论文,无论是Imagen还是Imagen Video,各自都有大篇幅涉及风险、社会影响力的内容。

出于安全、AI伦理和公平性等方面考虑,Imagen和Imagen Vedio都没有直接开源或开放API,甚至连demo都没有。

1c7ff840dc102a1c58850d86abd15aaa.png

哪怕市面上出现开源复刻版本,也不是最正宗的味道。

此前就曝出过在谷歌每年的内部员工调查“Googlegeist”中,员工表示对谷歌执行能力不佳的质疑。也许,这四人出走,继续做Imagen,并做Imagen的视频版,说不定就是为了想把项目放到一个更开放的AI环境。

而且这种出走创业,也是热钱大钱向AIGC汹涌的结果。

所以既然AIGC的创投热潮已经在太平洋那头开启,那应该在太平洋这头也不会悄无声息。

或许你已经听说了一些同样的大厂出走创业,欢迎爆料说说~~

— 联系作者 —

70166f86be167819a15417b928aa3593.jpeg

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办,峰会将邀请AIGC产业相关领域的专家学者,共同探讨生成新世界的过去、现在和未来。

峰会上还将发布《中国AIGC产业全景报告暨AIGC 50》,全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情:

寻找中国版ChatGPT,量子位邀你共同参与中国AIGC产业峰会

6552ca9bddf34309d1d809f6d50d57bc.gif

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11268.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

刘鹏报告:人工智能引领未来

2月16日,在“第七届挖贝北交所新三板领军企业年会暨挖贝金股奖颁奖盛典”上,刘鹏教授作主题演讲——《人工智能引领未来》,深度剖析了人工智能发展的三次飞跃,为现场嘉宾带来了一场科技盛宴。 刘鹏教授(配图来自挖贝网…

#挑战Open AI!马斯克宣布成立xAI,你怎么看?# 马斯克的xAI:充满困难与希望

文章目录 1.什么是xAI公司?2.xAI公司的图标3.“反AI斗士”马斯克进军AI:期待与挑战并存3.1 关于马斯克……3.2 这位“反AI斗士”……3.3 我的看法3.4 可能会遇到的困难与优势3.5 蓄谋已久的马斯克……3.6 xAI“全明星阵容”3.7 总结 4.百模大战&#xff…

大模型111人:谷歌和OpenAI的人才战争

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 当我们围观ChatGPT炸开的多场激战时,还有什么是暗流下激战的? 今天要关注的,不是违背“非盈利”初心的OpenAI,也不是商业模式面临颠覆的谷歌搜索。把目光从公司层面挪开,看向另…

什么是数字化营销?与ChatGPT结合能产生的化学反应?

随着时代的变迁,品牌营销的方式也变得愈加多样化。许多人或许都听说过数字化营销,在当今,这种营销手段非常受到品牌欢迎。今天,我们一起来了解一些有关数字营销的知识。看看它与当下大火的ChatGPT结合又能碰撞出怎样的火花&#x…

一脉相通!聊聊 ChatGPT 发展路线

作者 | 上衫翔二 整理 | NewBeeNLP 大家好,这里是 NewBeeNLP。 首页最近被chatGPT刷屏,但翔二博主左看右看发现很多想法似乎都是一脉相通的,于是连夜从存档中找了一些文章尝试理一理它的理论路线。 具身智能综述和应用(Embodied …

下载微信公众号中的视频

转:https://www.zhihu.com/question/29576861 火狐浏览器: step 1 火狐浏览器 step 2 选择红色框 step 3 点击播放音频/视频,音频/视频文件就会生成出来,找到【type】里面的【media】,双击media文件,选择…

如何下载微信公众号里面的视频?

在微信公众号里面有时候会有一些不错的视频,我们想要下载下来保存到自己本地,这时该怎么样来操作呢?下面我们就一起来看看怎么样下载微信公众号里的视频文件吧! ​1. 首先,我们进入到公众号里面找到要下载的视频,点击…

微信公众号文章下载的方法

最近下载了一款公众号文章下载器,可借助汉麻微云平台,实现公众号文章批量下载,再一键转发到官网以及官微、头条等自媒体平台。 操作步骤: 1、下载工具,此工具为绿色免安装版,启动即可使用(下载…

专属微信公众号消息推送(java版)

前言:专属女朋友的微信推送消息,简单的写个文档。 gitee地址:消息推送 所用框架及Api springboot搭建应用天行数据Api(彩虹屁、早安语句、天气) 前置条件 申请微信公众号测试号及微信模板配置 申请一个微信公众号…

微信公众号文章怎么加入文件下载

在微信公众号文章中加入附件下载对于运营者来说越来越重要,我经常要帮助学校发布招聘信息,需要在文章中带上报名表,所以也很需要在文章中插入报名表文档。之前都是用百度网盘,但是使用太麻烦了。 有朋友推荐了另外一个方法&#…

如何下载微信公众号视频

1、微信推文复制链接 2、使用谷歌浏览器打开链接(不用谷歌浏览器也可以,不过sefari没有检查,不能下载视频) 3、右键打开检查 4、查找视频资源 5、右键双击 6、下载 即可下载成功。 其实直接将视频全品播放也有下载按钮&…

微信公众号 下载文件 在浏览器打开

a.html 页面 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>在浏览器打开</title><meta name"renderer" content"webkit"><meta http-equiv"X-UA-Compatib…

手把手教你下载微信公众号里的视频

要达到的效果如题 下面就以这个视频为例子&#xff1a; 看电影听单词 | 第18期-《初恋这首情歌》 一、找到视频的vid 用chrome浏览器打开&#xff0c;按下F12&#xff0c;在element项里找到这段视频对应的src信息&#xff0c;其中有vid这一项。 这一步是很简单的&…

Python下载微信公众号文章和图片保存至本地

思路 获取到微信公众号的文章之后&#xff0c;使用 BeautifulSoup 和正则表达式 解析出文章标题和包含正文的html. 获取到html之后&#xff0c;用正则表达式获取图片下载链接&#xff0c;下载成功后将微信的链接替换成本地图片链接。 运行效果 代码 import requests from r…

微信公众号消息推送教程

微信每日定时推送消息提醒&#xff0c;这样的技术男友谁不爱呢&#xff01; 欢迎专注微信公众号【凯小白学编程】 一、注册一个公众号 不多赘述&#xff0c;一般的程序员都会开一个自己的公众号来玩吧~ 二、启用测试账号 因为公众号模板消息推送是服务号才有的功能&#xff…

uniapp微信公众号h5生成图片下载

背景&#xff1a;最近接到一个需求要在微信公众号h5动态生成海报长按进行下载。在各个浏览器是没问题的。去到微信公众号h5就不行了&#xff0c;百撕不得骑jie。后面发现是微信内置浏览器限制的原因。 需求&#xff1a;根据链接动态生成二维码&#xff0c;再结合背景图等标签生…

下载微信公众号全部文章的方法

如何能将看到的非常葚欢的公号文章一网打尽&#xff1f;有将近十个号是学习个人成长&#xff0c;但是每个号都有几百篇历史文章&#xff0c;目己只能零星的看到就存到有道或印象笔记&#xff0c;但还是差的很远•很想找个方法突似程序之类的将这些文章都保存下来然后排版打印字…

微信公众号使用:查看和下载微信公众号的二维码

作为微信公众号的维护人员来说,不仅要知道微信公众号的基本功能,还要知道微信公平台的法律法规,发布文章的规则等常识。微信公众号申请成功之后,查看并下载微信公众号的二维码是比较常见的需求,而且添加微信公众号的时候不仅是通过搜索添加,也要通过直接扫描二维码识别添…

ChatGPT编程准确率暴降13%!UIUC南大新基准让AI代码现原形了

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 用ChatGPT写代码&#xff0c;已经是不少程序员的常规操作了。 △“至少提速3~5倍” 但你有没有想过&#xff0c;ChatGPT生成的代码&#xff0c;有不少只是“看起来准确”而已&#xff1f; 来自伊利诺伊大学香槟分校和南京大学的一项最新…

奇舞周刊第 487 期 可在控制流中调用!React 新 hook 尝鲜

记得点击文章末尾的“ 阅读原文 ”查看哟~ 下面先一起看下本期周刊 摘要 吧~ 奇舞推荐 ■ ■ ■ 可在控制流中调用&#xff01;React 新 hook 尝鲜 React 在之前的文档中提到了 Suspense for data fetching[1] 的理念&#xff0c;虽然在新的文档中下线了&#xff0c;但还是有相…