衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
大模型创业江湖,又来了两位重磅大牛。
张家兴,粤港澳大湾区数字经济研究院(IDEA研究院)讲席科学家、认知计算与自然语言中心负责人,被曝已经启动了创业项目,而他站在他身后,以顾问身份出现的是知名AI大牛、IDEA研究院创始理事长沈向洋。
量子位获悉,张家兴新公司据说代号深度空间,大方向是打造大模型底座,希望瞄准B端市场打造企业级应用。
以及大牛创业多的是排队想进的投资者。所以即便项目尚未官宣,也只是小圈子里所知,但首轮估值已经高达数亿美元。
而张家兴,从过往履历和能力来看,确实也值这个价。
去年开源中文版Stable Diffusion
张家兴,北京大学电子系博士毕业,师从侯士敏;本科阶段在南开大学学习嵌入式系统。主要研究领域为AI、DL和分布式系统。
加入IDEA研究院之前,先后就职于百度、微软、阿里巴巴,曾任微软亚洲研究院研究员、360数科首席科学家。
△张家兴
在微软亚洲研究院期间,2014年,深度学习框架研究正处于萌芽期。张家兴在工作Minerva(发表于顶会NIPS,即后来的NeurIPS)中,提出用高级语言表述网络结构和用数据流图(dataflow graph)来解耦网络结构和执行引擎。
——这是后来出现的Tensorflow、Pytorch等主流深度学习框架的核心设计理念。
同年,他在NIPS发表的另一篇论文《Attentional Neural Network: Feature Selection Using Cognitive Feedback》里提出了Attentional Neural Network,以认知概念作为query对输入进行选择。
这个概念的提出,比attention成为主流早了一年。
△《Attentional Neural Network: Feature Selection Using Cognitive Feedback》
公开资料显示,离开MSRA后,张家兴先是任职阿里巴巴蚂蚁金服AI资深算法专家,“从零到一创建了阿里巴巴和蚂蚁集团的深度学习团队”。
又以360数科(原360金融)首席科学家的身份,“组建了360数科的AI数据融合中台部门”。
2021年,张家兴加入IDEA研究院,角色是认知计算方向负责人,参与过IDEA研究院发布的“悟道·文源”等大模型项目。
去年,AIGC在文生图领域刮起一阵风暴,张家兴带领团队开源了第一个以中文为主的AI绘画模型太乙——它被称为中文版的Stable Diffusion,并在11月1日推出纯中文版本和中英文双语版本。
据透露,太乙的训练数据量超过了1亿中文图文对。
△太乙根据提示词“小桥流水人家,水彩”生成的画作
张家兴曾对外表示,在IDEA前作Taiyi-CLIP-Roberta-large-326M-Chinese、Taiyi-Diffusion-532M-Nature-Chinese等的基础上,太乙团队从全力投入到完成面世,“用时不足一个月”。
在IDEA同时推进的还有他带领团队创建的“封神榜”大模型开源计划,截至去年年底,共开源了88个模型。
今年2月底举办的“2023全球人工智能开发者先锋大会”上,张家兴曾在圆桌讨论上公开表达:
我也是在这一波ChatGPT创业的大潮里边,准备入局。
不过一个来月,张家兴已经身体力行地动起来了。
不仅自己躬身入局,还拉了IDEA研究院理事长沈向洋一同在大模型之路上探索。
新公司还有谁?
在新公司担任顾问的沈向洋,是IDEA研究院的创立者,包括ACM和IEEE等全球计算机顶级组织的Fellow,前微软乃至科技巨头里最具权势的华人高管。
他博士毕业于CMU计算机学院,是图灵奖得主Raj Reddy的学生,主要致力于计算机视觉、图形学、人机交互、统计学习、模式识别和机器人等领域。
后来沈向洋与李开复、张亚勤、洪小文共同参与创建影响深远的MSRA。
此外,他还是微软必应、微软小冰等一系列知名产品的领导打造者,并因计算机视觉和图形方面的研究成就享誉世界。
△沈向洋
2019年11月,微软对外公告称:全球执行副总裁、AI及技术研发体系负责人沈向洋博士,将于2020年2月正式从微软退休。
于是2020年开始,沈向洋挥别了任职23年之久的微软。
但他并未远离AI江湖,沈向洋先后出任了小冰公司、Newsbreak的董事长,其后又亲自参与创办了base粤港澳大湾区的IDEA研究院成立,担任创始理事长。
在沈向洋的带领下,IDEA迅速集结起大批人才,其门生故吏云集,迅速打响了影响力。不仅没落下去年爆火的AI绘画,打造并开源太乙模型,今年的AIGC浪潮也没有落伍。
而且就在最近——IDEA还发布了zero-shot的视觉应用Grounded-SAM,把目标检测、分割、生成几大视觉AI功能all in one。
发布至今不足半个月,已经在GitHub上狂揽7.2k星。
张家兴谈大模型
不过目前,还不知道张家兴为何“出走”创业,或者新项目和IDEA研究院之间是否存在关联。
张家兴原本就是沈向洋在MSRA治下的老兵,但后来加盟蚂蚁集团,后来又辗转360担任首席科学家。
2021年6月,张家兴正式加入IDEA研究院担任认知计算方向讲席科学家 。做为认知计算方向的负责人,带领团队,在认知计算和自然语言相关的各个方向进行前沿探索。
他最近一次公开亮相是今年3月,在2023全球AI开发者先锋大会现场,他与几位微软系老朋友,纵论大模型和ChatGPT变革后的世界,他认为ChatGPT的出现,开启了一个新十年。
并且这个新的十年,就是Generative + General,就是未来是属于生成式AI和通用AI的。
在这次讨论中,张家兴还留下了名言:
如果我们套用《三体》里面非常著名的一句话,“物理学不存在了”,那么我们今天从某种意义上也可以说,NLP技术不存在了。
— 联系作者 —
— 完 —
《中国AIGC算力产业全景报告》征集启动
AIGC算力需求爆发,谁将在此次算力产业变革中脱颖而出?
量子位《中国AIGC算力产业全景报告》和《最值得关注的AIGC算力玩家》正式启动对外征集,期待有更多优秀的机构产品、案例与技术能够被大众看到。
点这里👇关注我,记得标星哦~