腾讯大手笔投资大模型,清华系AI公司赢麻了

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

投研并举,这是腾讯目前快速布局大模型的策略。

量子位获悉,就在最近一轮清华系AI公司的融资中,腾讯已经出手下注,帮助其中一家风口上的公司快速完成10亿级别的Pre-A+轮融资——这家公司叫深言科技(DeepLang AI),源流自清华大学自然语言处理实验室(THUNLP) 。

深言还曾陷入美团老王的并购传闻,但目前为止,被资本层面证实的最重要战略投资方,依然是刚刚浮出水面的腾讯,以及好未来——这也是好未来首次公开投资大模型公司。

但对于腾讯,深言只是大模型布局的提速。更早之前,腾讯被曝4000万美元重注投资了MiniMax,帮助其快速晋升为大模型独角兽。

腾讯话事人马化腾已经表态,对于大模型这样的时代级浪潮不会袖手旁观,但也不会急于求成搞半成品,会专心搞好研发。

但随着接二(尚未)连三的投资布局曝光,也能看出腾讯对大模型技术的决心和重视,以及对于大模型创投市场而言,这同样是个振奋的消息,毕竟此时此地的创投市场,满揣现金的腾讯进场,对不少VC都意味着退出保障和市场信心。

清华系AI初创公司深言科技?

深言科技成立于2022年3月,主要面向AI和NLP,目标是用AI及NLP技术,尤其是大模型技术,全流程服务信息处理。

创始人兼CEO岂凡超,是清华大学计算机科学与技术系2017级博士毕业生,本科时期就读于清华电子工程系。

在校时,他是THUNLP的一员。其主要研究方向为NLP,曾在EMNLP等顶会发表论文30多篇。

015cdc50e7552057334ad3c9f91473d3.png

联合创始人兼COO李潇翔,清华电子工程系2017级博士。红杉中国合伙人张涵也是公司董事之一。

公司当前对外公开的产品,最引人注目的是WantWords和WantQuotes。

WantWords,中文名叫反向词典,产品在2021年11月时一度走红微博,服务器被多次挤爆。

019ee7df60297344e0dae0602e5ff338.png

反向词典的开发要追溯到更早期,2019年,岂凡超就和同学合作研发了该产品,不仅支持支持中文及跨语言查询,还进行开源。

项目背后的核心AI,名为多通道逆向词典模型,相关论文中选过AAAI 2020。

而反向词典的项目指导教师一栏中,就有岂凡超的导师,清华大学计算机科学与技术系教授、博士生导师,清华大学人工智能研究院常务副院长孙茂松

孙茂松和岂凡超的合作在后者毕业后仍然继续。

去年岂凡超博士毕业后,随即与多位清华硕博背景同学一道,从THUNLP孵化出深言科技。

现在担任深言科技首席科学家的,正是孙茂松。

同时,THUNLP实验室的反向词典和后续推出的据意查句(WantQuotes)等,也划归深言名下。

关于为深言科技生长提供土壤的THUNLP,这里再多说两句,它是国内第一个开展NLP研究的科研单位,70年代就已经成立。

彼时的牵头人是国内NLP研究领域的趟路人黄昌宁,也是孙茂松的恩师。

反向词典另一名项目指导教师刘知远同属THUNLP实验室,他是孙茂松的学生。

caf372d9e3e14c1b98e1d1a4c769c4da.png

实验室此前推出的项目,颇受关注的主要有三:

  • 中文诗歌自动生成系统九歌MixPoet,它训练过程中学习了80万首中国古诗;

  • 语言表征模型ERNIE(和百度文心大模型同名),可与当时任务最优的BERT媲美;

  • 以中文为核心的预训练大模型清源CPM,是智源研究院大模型悟道·文源的前身。

上述项目研发过程时,岂凡超等人尚未毕业,仍身处THUNLP。

投研并举的腾讯

此前业内流传一种说法,“腾讯正在变成一家投资公司”。

这种说法背后的观点认为,看腾讯是否布局一个行业、一个领域,往往是看它向哪个地方砸了钱,而不是自己的业务团队在做些什么。

对此腾讯当时的回应是,除了自主开拓多条事业线利用好这些流量以外,不核心的、不专业的项目都会通过投资,交给其他更合适的团队去做。

在大模型领域,腾讯显然没有因为对外投资就放弃自己内部的动作,只不过不那么“着急”而已——

日前的腾讯2023股东大会上,被媒体描述为“身形暴瘦,快认不出”的马化腾,分享了大模型的观点:

腾讯也在埋头研发,并不急于把半成品拿出来展示……
我感觉现在有很多公司太急了,感觉是为了提振股价,我们一贯不是这种风格。

此前他还在Q1财报电话会上回应腾讯在大模型方向上的“慢动作”:“对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要的。”

虽然“不着急”,但腾讯自身在大模型领域并非毫无动作。

最直接的消息,就是腾讯内部打造了混元大模型,在今年4月首次对外披露。

而后又公布了新消息,推出国内首个低成本、可落地的NLP万亿大模型。

并且,针对传闻中“腾讯针对类ChatGPT对话式产品成立‘混元助手’项目组”,腾讯给出回应:相关方向上已有布局,专项研究也在有序推进。

据职场Bonus消息,这个项目组的负责人大有来头,是腾讯史上最高职级拥有者,张正友(腾讯首位17级研究员/杰出科学家)。

与此同时,随着大模型群雄逐鹿,对算力的需求激增,腾讯还另辟蹊径,在算力层面着力

根据腾讯Q1财报,腾讯云计算等ToB业务占据了收入的30%,同时,面向大模型训练,腾讯采用了最新自研服务器。

以训练自家大模型效果为例——万亿参数的混元NLP大模型训练。在同等数据集下,将训练时间由50天缩短到11天。如果基于新一代集群,训练时间将进一步缩短至4天。

611f2aafe05f8f4eb68ee3b2b71518f0.jpeg

技术层面的推进也在持续进行,3月宣布成绩的信息检索领域顶会WSDM(Web Search and Data Mining)宣布WSDM CUP 2023竞赛成绩。

来自腾讯研究团队的在无偏排序学习互联网搜索预训练模型赛道上的两项任务中获得冠军,现在这两项成果代码和论文均已发布在GitHub。

二者中的后者与大模型息息相关,因为数据标注的质量对于模型的效果有着较为显著的影响。

比赛中,针对基于搜索的预训练任务(Pre-training for Web Search),腾讯团队通过大模型训练、用户行为特征去噪等方法,在点击日志上进行基于搜索排序的模型预训练,进而使模型有效地应用到下游相关性排序的检索任务。

25cd09ef95e1156123b1c45b3a72b494.jpeg

现在,随着对MiniMax和深言科技的先后押注,腾讯对大模型领域的内外布局逐渐开始拨云见日。

腾讯仿佛在走与微软类似的路线,投研并举,即自主研发的同时,不忘对外投资市场看好或拥有技术背景的AI初创公司,一如微软对OpenAI的押注。

随之而起的还有创投圈四起的哀嚎:

大厂战投在大模型一出手就把估值拉贼高,跟不起了啊啊啊啊啊啊啊!!!

但另一方面,大厂战投进场,同时也意味着最有保障的退出机制来了。

毕竟移动互联网时代争夺“门票”的那几年,UC也好,91也罢,不都是这样吗?

— 联系作者 —

673be8211b1fce21a13be4de84589872.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/53588.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

纠错老板马斯克后,Twitter 工程师遭解雇!

“杀疯了”的马斯克,留不住的 Twitter 员工。 作者 | 苏宓 出品 | CSDN(ID:CSDNnews) 马斯克,凭借着直言不讳、果敢的操作,这位掌握了流量密码的企业家自 10 月 27 日以 440 亿美元完成推特私有化交易以来…

主动出击,马斯克欲用 430 亿美元拿下 Twitter

毫无疑问,今天科技板块的头版头条又是属于埃隆马斯克的。 距离马斯克公开自己入股 Twitter 获得了 9.2% 股份刚过去 9 天、距离 Twitter CEO Parag Agrawal 宣布马斯克不加入 Twitter 董事会刚过去 3 天后,「语不惊人死不休」的马斯克在向美国证券交易…

Twitter 推荐算法开源,马斯克被“特殊照顾”

整理 | 梦依丹 责编 | XXXXX 出品 | CSDN(ID:CSDNnews) 在马斯克反复承诺表示要开源 Twitter 推荐算法之后,3 月 31 日,Twitter 部分推荐算法源码正式在 GitHub 上开放,采用 GNU Affero General Public L…

Twitter部分源代码泄漏、疑遭离职员工报复:马斯克要求GitHub交出所有上传、下载人员名单

最近的法律文件显示,Twitter 的部分源代码已经在网上泄露。这是一次罕见的、严重的知识产权泄露事件。为防止该事件对其服务产生潜在的破坏性损失,Twitter 已经采取了法律行动。 部分源代码在线泄露 根据文件显示,上周五 Twitter 采取了行动…

一个命令行的 Copilot:ai-shell

目录 简介 安装 使用 特殊字符 静默模式(跳过解释) 自定义 API 端点 聊天模式 设置语言 配置界面 版本升级 Github 之前发布了 GitHub Copilot CLI,有了它你可以在你的命令行控制台中通过自然语言让它帮你写出 shell 命令&#xff…

Java枚举意外触发了Mybatis Plus的BUG

点击关注公众号:互联网架构师,后台回复 2T获取2TB学习资源! 上一篇:Alibaba开源内网高并发编程手册.pdf 问题 昨天用mybatis-plus写了一段crud,代码如下: TransactionalOverridepublic boolean updateTaskS…

亚马逊加入大模型竞赛/ 滴滴可打自动驾驶车/ 百度副总裁回应王小川…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是4月14日星期五,马上又要到周末啦~ 今天科技圈有哪些新鲜事儿,和日报君一起来看看~ 百度副总裁回应王小川:确实不在一个宇宙 无论国内还是国外,人工智能的竞争可…

不用任何软件,批量转化图片格式

不用任何软件,批量转化图片格式 文件夹里有上百张图片,如何批量修改格式? 其实不用任何软件,不用任何转化工具就能实现这一目的。 这是Windows系统自带ren(rename-重命名)命令,利用rename命令…

3个无敌实用的图片转换器,上百种图片格式任意转

分享3个万能的图片格式转换工具,每个基本上都提供了上百种图片格式转换,而且压缩后的图片一点都不会损坏原画质,压缩完成后还能自动下载保存到相册,转换速度不仅快而且还提供了其他的图片处理功能。 1、万能图片转换器 一个超级丰…

使用手机将图片转换成PNG格式怎么做?教你三种转换方法

怎么使用手机把图片的格式转换成PNG格式呢?现如今的图片格式种类非常之多,有很多种格式的图片我们甚至都打不开它。有时我们需要上传一些照片文件,会有要求照片只能是PNG格式,遇到这种情况我们该怎么使用手机就能够就能将图片格式…

PNG图片怎么转成ICO?分享两种思路

ICO作为一种图标文件随处可见,在设计的时候偶尔会需要将PNG图片转为ICO格式。那么PNG图片怎么转成ICO呢?我们可以使用转换工具或登录在线网站进行处理,下面推荐两种方式,点赞收藏不迷路哦。 一、格式转换工具拥有对PDF文件全面的格…

微信电脑版DAT图片文件转JPG/PNG图片的简单工具

平常微信聊天中发出和接收到的图片,都是经过编码后再保存在电脑中的,普通方法打不开 如果需要整理,则是个问题 本文详细说明如何快速地把平常微信聊天中存储在电脑中的聊天图片转换成普通图片 支持JPG和PNG 文件存储位置 首先找到这些图片 …

IMZO创建高品质免费图片库,图片可全球范围免版税商业使用

美通社消息:IMZO是免费提供海量高分辨率图像的全球平台。该平台无需订阅,无附加条件,无隐藏收费。用户只需点击并下载最大8100x5400像素的300dpi最佳创意照片。 平台的全部收藏中包括生活方式、商业、医疗保健、技术等诸多类别的海量图片。IM…

iOS 摸鱼周报 #84 | 开箱即用的云服务 AirCode

本期概要 本期话题:开发加速器:在 App 或游戏内创造无障碍体验本周学习:Any 和 AnyObject 以及 AnyClass 内容推荐:依赖注入、自定义 Button 外观与行为、正则表达式、创建 XCFramework 以及创建可配置的小组件文章推荐摸一下鱼&a…

企业流程中心BPM产品搭建

一、为什么要搭建企业流程中心 企业发展初期,会制定一堆制度,用来规范企业管理,但制度更多是奖励和惩罚的作用,并不能提升管理和业务效率。 比如,我们开车走高速的时候,超速会扣分、会罚款,这是…

Python彩色图片转手绘风格

Python彩色图片转手绘风格 from PIL import Image # 图像的手绘 """黑白风格边界的位置比较重相同或相近色彩趋近于白色咯有光源效果 """ # 读取彩色图片并转化为np数组 a np.array(Image.open(r114362.jpg).convert(L)).astype(float)depth 1…

值得拥有的手绘风格画图工具

一直在找一款手绘风格的画图工具,好的图表总能传递更多的信息。最初用微软 Visio 工具画图,但依赖于安装软件,无法轻量级使用,效果也有些僵硬,后来改用 ProcessOn 在线画图,免费版有数量限制。后面使用 Dra…

为什么有计算机绘图了还要学手绘,设计师有必要学习手绘吗?

文/刘伦利 当前,电脑及相关软件的应用已经越来越普遍,特别是艺术设计专业,各种设计软件已作为设计专业中的辅助工具,占有重要的地位和作用。很多初学者认为只要学了计算机就可以做所想的设计图,并没有认识到没有原始的…

教你如何几行python代码实现图片转手绘

这里是运行效果 先展示一下完整代码,后面在进行分析 # -*- coding: utf-8 -*- from PIL import Image import numpy as npim Image.open(really.jpg).convert(L)#really.jpg是这里将用于转换的原图 a np.asarray(im).astype(float) # 将图像以灰度图的方式打开并…

如何用计算机制作pop海报,ai怎么制作pop海报字体?ai简单快速制作pop字体教程

版权申明:本文原创作者“xifenu”,感谢“xifenu”的原创经验分享! 怎么用ai制作海报上的pop字体?接下来小编就给大家分享一篇非常实用的ai简单快速制作pop字体教程,希望对你们学习ai制作pop海报字体有帮助,…