衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
又一家AI初创大模型公司,刚刚浮出水面。
名为月之暗面,主要业务剑指AGI。
成立后已迅速完成首轮市场融资,获红杉、真格等一线VC的押注,市场估值被曝约在3亿美元。
公司拥有明星团队,核心成员多出身清华系,尤其是其主要创始人,是清华教授唐杰得意门生、清华大学交叉信息研究院助理教授。
没错,此人就是杨植麟。
他身上携带的“光环”还有很多:
Transformer-XL与XLNet一作,还是苹果公司AI负责人Ruslan Salakhutdinov在CMU的亲传弟子。
他一度在Facebook AI Research和Google Brain效力,发明的算法曾在30多项AI标准任务取得SOTA,2016年时就成立NLP公司循环智能……
不过,新公司并非循环智能的延续,而是杨植麟正式入局大模型另外搭起的炉灶。
“杨植麟被寄予厚望,由国内最头部的VC提供孵化式支持。”今年2月,OpenAI和Google大战掀起国内第一浪百模大战时,就有这样的市场消息传出。
现在终于拨云见日,新公司月之暗面来到明面。
杨植麟其人
现年31岁的杨植麟,本科就读于清华大学计算机系。
高中时期,没有任何编程基础的杨植麟被选拔进信息学奥林匹克竞赛培训班,最终通过竞赛保送清华大学。
但是最初,他就读的并不是计算机专业。直到大二时,他惊觉自己还是对计算机的兴趣更浓,于是果断转入计算机系,师从清华教授、IEEE Fellow唐杰。
他曾公开表示,
后来发生的一切,都让我觉得转到计算机系,是目前为止我生命中最正确和重要的决定。
计算机系就读期间,杨植麟以满分成绩通过所有程序设计课程。
2015年,他以年级第一的成绩毕业,随后远赴CMU(卡内基梅隆大学)语言技术研究所(LTI),跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。
△杨植麟与Ruslan Salakhutdinov(右一)、William Cohen(左一)合影
CUM就读期间,杨植麟就动作频频,惹人瞩目:
与图灵奖得主Yoshua Bengio合作发布“火锅问答”数据集HotpotQA。
又以一作身份,发表《XLNet: Generalized autoregressive pretraining for language understanding》和
《Transformer-XL: Attentive language models beyond a fixed-length context》,在NLP领域产生重要影响。
前者成为NeurIPS 2019与ACL 2019的最高引论文之一,Google Scholar引用次数破7000,后者引用次数也近3000。
杨植麟曾和Yoshua Bengio(图灵奖得主,深度学习三巨头之一)、Yann LeCun(图灵奖得主,又一个深度学习三巨头之一)、Quoc V. Le(Google Brain创始人之一)、何恺明(Kaiming He)等合写过论文。
据不完全统计,杨植麟曾在ICLR、NeurIPS、ICML、ACL、EMNLP等计算机顶会发表论文20余篇,研究成果累计Google Shcolar引用超过17000。
一般情况下,CMU的博士学位之旅6年起步,但仅仅花费4年时间,2019年,杨植麟就顺利拿下博士学位。
不过,早在博士二年级就读时的2016年,杨植麟就开启了他的第一次创业。
创立循环智能(Recurrent.ai),主要业务是运用NLP、语音、多模态、大模型等AI技术打造“销售科技”方案。
据报道,循环智能AI系统后台已经积累了数千个来自不同行业的语义模型。
2021年,循环智能与华为云合作开发了千亿级NLP大模型盘古大模型,涉及NLP、CV等多个方向,在部分实际场景中达到了优于Bert与GPT系列的效果。
此外在创业途中,杨植麟还抽身主导了智谱AI、智源研究院、清华研究团队的多个AI项目。
ChatGPT爆火之后,专注NLP领域,又有大模型经验的杨植麟颇受关注。Information在撰写稿件时,曾将杨植麟列为“中国OpenAI打造者Top5”之一。
探寻“月之暗面”
企查查App显示,北京月之暗面科技有限公司(以下简称月之暗面)成立于4月17日,法人为杨植麟,注册资本100万元人民币。
除杨植麟外,公司创始团队还有3人。
另一名创始成员张宇韬,同时是循环智能的联合创始人,兼任公司CTO。
张宇韬自清华大学计算机系博士毕业,和杨植麟师出同门,都是唐杰的学生——二人在清华大学KEG实验室(知识工程实验室)结识。
张宇韬的研究方向是异构数据融合和知识图谱构建,在KDD、CIKM等计算机顶会上发表多篇文章。
公开资料还显示,他作为技术负责人,参与了科技大数据分析平台AMiner的研发。
△张宇韬
公司股东列表里,还出现了周昕宇的名字。
他是清华大学2011级本科生,和杨植麟、张宇韬同为计算机系的学生。
周昕宇在毕业后选择加入旷视,工作内容是算法量产。
就职期间,他和旷视研究院基础科研负责人张祥雨一道,研究移动端模型,以共同一作的身份撰写《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices》,中标CVPR。
ShuffleNet后来影响了包括苹果3D人脸解锁在内的各种手机毫秒级人脸解锁技术。
△周昕宇
第四位公司创始成员是汪箴。
公开资料显示,汪箴毕业于复旦大学计算机科学系,后就读新加坡南洋理工大学计算机工程系,主要研究工作面向AI在鉴证科学上的应用。
此次创业之前,汪箴曾在Google担任高级软件工程师/技术主管,开发移动端网页搜索、社交平台等产品。
后又担任新加坡AI技术驱动独角兽领创集团(ADVANCE.AI)技术委员会负责人/技术副总裁,还有过投资机构的从业经历。
△汪箴
细数起来,月之暗面的核心创始班底四人颇有技术底色,这种组成结构也与同一时期创业的诸多AI初创公司一样。
杨植麟还在自己的个人主页上写道:
我所有工作的最终目标,包括研究和商业,都是实现AI价值最大化。
上一次创业时,谈及创业初衷,杨植麟曾这样放话:
我想有一条更激进、更彻底的路径去打破学术界与工业界的壁垒。
不知道现当下,激流勇进成立新公司二次创业的他,又会走什么样的创业路线?
One More Thing
杨植麟从小就有个成为摇滚明星的执念。
本科期间,杨植麟创立了摇滚乐队Splay,并担任鼓手——乐队名取自数据结构Spkay Tree。
(合理猜测月之暗面灵感来源于Pink Floyd专辑《The Dark Side of The Moon》)
有趣的是,本次创业的其中一名参与者周昕宇,和杨植麟在彼时就缔结了缘分。
他们最终在清华东门外的一家餐馆里,讨论并定下组乐队的事情。
后来乐队创作了一首歌,大概讲述了一件事,有关“做了一个创业成功一夜暴富的白日梦”。
当时觉得圈子里很多人在做着阶级跨越的努力,写这首歌一方面出于共情,一方面也是希望自己不要成为过于功利的人。
参考链接:
[1]https://scholar.google.com.hk/citations?user=7qXxyJkAAAAJ&hl=en
[2]https://www.qcc.com/firm/963bdccb2d608df007ee74f2c4355bad.html
[3]https://mp.weixin.qq.com/s/NYzQCKC7YL0Nt43S8c21zQ
[4]https://mp.weixin.qq.com/s/iU26yT8gb5uDzpUB-_yK9Q
— 联系作者 —
— 完 —
「AIGC+垂直领域社群」
招募中!
欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!
请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。
点这里👇关注我,记得标星哦~