AI大牛周明发布MChat:生成可控,参数规模可负担,顺便官宣了新融资

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

大模型赛道又有融资新动态:

语言大模型玩家澜舟科技,刚刚完成了Pre-A+轮融资。

本轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。这是澜舟科技1年内收获的第2轮融资,2轮累计总额数亿元。

不止于此。和融资消息一同公布的还有澜舟科技推出的语言生成模型,孟子MChat可控大模型

它有类ChatGPT的能力,加上原来澜舟科技孟子大模型N个项目功能引擎,最终呈现出来的MChat,既有对话能力,又具备翻译、生成、信息搜索等能力。

关于MChat,澜舟科技创始人兼CEO周明还作了如下介绍:

  • 将陆续推出10B和100B参数级的大模型;

  • 具备聊天、问答、翻译、文本生成、信息抽取等多种能力;

  • 可融合搜索结果、领域数据和知识图谱;

  • 对功能、风格、人类认知等方面具可控性。

62284cb3334d34a9de9089c0d374a21a.png

孟子MChat可控大模型

本次融资是创新工场对澜舟科技的“继续跟投”。

创新工场董事长兼CEO李开复在3月14日的趋势分享会上谈到,AI已经来到从1.0迈入2.0的拐点。

顺着这个思路,MChat可以视为澜舟科技尝试从平台基础设施两个层面迈入AI 2.0时代的具体动作:

首先,发布迭代而来的孟子MChat可控大模型,视其为通用底座,提供语言预训练模型、多模态预训练模型、垂直领域预训练模型等能力。

其次,再在其上架构能力平台,提供知识图谱、辅助写作、机器翻译等模块化能力。

8f745f5d50ec8dd9c76eeddc99cfe5cf.png

据周明介绍,团队走访了100多家公司,发现市场需求迥异。这种情况下,澜舟科技认为在更垂类的赛道做定向优化显得尤为重要。

也因此延伸出孟子大模型技术体系的特点之一,更多样化

具体而言,就是孟子支持BERT(分析类)、GPT(生成类)和T5(翻译类)等架构,能够覆盖阅读理解、文本生成、机器翻译、对话等不同场景。

值得注意的是,MChat虽然具有ChatGPT同样的对话能力,但两者有所不同。

ChatGPT尽可能将多模态数据纳入训练库,数据量越大越好,不甄别数据好坏;

而MChat强调“可控性”

一是功能可控,即根据具体需求加减可调用的具体功能;二是结果可控,保证输出内容的健康、良性。

“未来我们是想继续探索从AI 1.0到2.0到AGI,”周明说,“不过AGI有点太远,但下一步已经确定,就是从单语言扩展到更多的语言。”

选择在这个时间点进军AI 2.0时代,澜舟科技似乎地利不足,放眼大模型创业领域,千帆竞赛;但好处是已有诸多铺垫,且孟子轻量化模型的能力已经经过验证

MChat背后依托的孟子大模型,是澜舟科技自研技术研发的大规模预训练语言模型,于2021年7月推出。

可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务,快速满足不同领域、不同应用场景的需求。

与追求打造AGI不同,基于Transformer架构的孟子,行进路线是轻量化——仅包含10亿参数。

靠这10亿参数,孟子大模型在中文语言理解领域最具权威性的测评基准CLUE上屡次刷榜第一,四两拨千斤,击败其他公司百亿甚至千亿的模型。

72e4b60fc2bb4b2eab297f316aadb0fb.png

到具体的应用层面,同花顺、华夏基金为代表的金融领域,以及中文在线代表的文案写作领域,澜舟科技都以孟子大模型为底座提供了能力支撑。

NLP大牛周明

澜舟科技是以NLP技术为基础的认知智能公司,由AI大牛周明创办的公司,成立于2021年6月。

周明,当今NLP领域成就最高的华人之一,他不仅是中国第一个中英翻译系统的研制者,还在2019年成为AI语言领域最高级顶会ACL(国际计算语言协会)主席。

1991年在NLP重镇哈工大拿到博士学位后,周明进入清华任教;1999年被微软亚洲研究院创始院长李开复挖走,后来不久成为NLP研究组负责人。

6a30ab824d559cc055389cc0a290c626.jpeg

2020年离开MSRA加盟创新工场担任首席科学家时,周明已担任MSRA副院长多年。

从工作21.5年的MSRA出走的原因,周明有些戏谑地解释:

“2020年年底,我隐隐约约感知到未来大模型要兴起,所以毅然决然离开微软,成立澜舟科技,专门从事大模型研究。”

据介绍,除了孟子大模型外,目前澜舟科技已经开源了近20个大模型

如果真如李开复所说,AI来到了从1.0过渡到2.0的拐点,这对NLP意味着什么?

周明一边提到,AI 2.0反映在NLP,能看到GPT这样的通用模型,一套模型解决很多问题,效率大幅提升;一边又提出了两个现象

一是AI 2.0时代的NLP能力足够强,在处理新任务时只需用一个提示词来代替它的能力;

二是模型大到一定程度时,会涌现新的能力,尤其是会迸发出一些从未见到过的能力。

他个人表示出对新能力涌现的格外关注,因为涌现这件事目前还是未解之谜,“唯一能启迪你的是在能力范围之内,尽量把模型做的比较大”。

ChatGPT身上的逻辑和思维能力,就是由GPT系列模型的大力出奇迹出品。既然如此,澜舟科技会不会也在模型参数上加码?

周明直截了当地回答,澜舟不会去追从千亿、万亿大模型

我们会尊重大模型,把模型做到相当大,但同时快速考虑它的落地。

49ec7a19647c588e60fa13bf406ad4e8.png

关于大牛周明和他对大模型的最新思考,欢迎锁定3月29日量子位举办的中国AIGC产业峰会,周明博士已经确认出席并带来最新思考。

— 联系作者 —

8968c22bfb2f73a0fde3d3c3eb1b2b8d.jpeg

3月29日「中国AIGC产业峰会」

抢票开启

「中国AIGC产业峰会」定档3月29日,线下会场抢票开启!

百度袁佛玉、智源林咏华、澜舟科技周明、小冰徐元春、科大讯飞高建清、启元世界袁泉、云舶科技梅嵩、特赞王喆、微软关玮雅、源码资本黄云刚、元语智能朱雷、无界Ai马千里、Tiamat青柑、峰瑞资本陈石等来自产学研界大咖嘉宾,还有重磅嘉宾陆续确认中。

扫描下方二维码,报名峰会线下会场啦~

beda57c6573d951a06256235e2ba214b.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15172.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

传奇大神何恺明被曝回归学界,网友:要成全MIT引用最高的人了

AI大牛何恺明有了最新动向,而且是回归学术界。 MIT CSAIL实验室发布公告,3月13日下周一,何恺明将到MIT做学术演讲。 此事引起AI圈广泛关注。在相关知乎问题下,MIT博士Charles指出,何恺明参加的这个研讨会全是Job Tal…

OpenAI是什么

目录 OpenAI是什么 OpenAI的发展历程 OpenAI的研究原则 OpenAI的特色产品 ChatGPT DALLE 2 Whisper OpenAI是什么 OpenAI的发展历程 2015年由马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得蒂尔等硅谷科技大亨创立。 2016年6月…

【人工智能】大比拼:文心一言 VS ChatGPT —— 禅与计算机程序设计艺术亲自测评

收到了百度“文心一言”的内测邀请,现在给大家亲身体验测评一下! 禅与计算机程序设计艺术先说结论: 文心一言表现基本符合预期。与ChatGPT有一定差距,应该在几个月左右。但是禅与计算机程序设计艺术,挺期待 ChatGLM-130B 版本的效果的。因为,ChatGLM-6B在本地测评的效果,…

贝壳找房挖到AI大牛叶杰平,房产中介转型需要技术,高估值更需要

杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 前滴滴AI实验室负责人叶杰平,去贝壳找房了。 没错,从“行”到“住”,从“车”到“房”。 贝壳找房官宣,叶杰平正式加入,任技术副总裁、首席科学家,并将全面负…

超越CLIP!谷歌发布首个大规模MoE架构的视觉语言模型

文 | 明敏(发自凹非寺)源 | 量子位 多模态模型常见,但是基于稀疏化的还是头一个。谷歌带来最新成果LIMoE,首次将稀疏化方法用在了图像文本混合模型上。要知道,随着大模型参数呈指数级增加,训练成本也是一路…

【论文阅读】Hierarchical Multi-modal Contextual Attention Network for Fake News Detection --- 虚假新闻检测,多模态

本博客系本人阅读该论文后根据自己理解所写,非逐句翻译,欲深入了解该论文,请参阅原文。 论文标题:Hierarchical Multi-modal Contextual Attention Network for Fake News Detection; 关键词:社交媒体&am…

混合专家系统(MoE)

混合专家系统(Mixture of Experts) 原理: 混合专家系统(MoE)是一种神经网络,也属于一种combine的模型。适用于数据集中的数据产生方式不同。不同于一般的神经网络的是它根据数据进行分离训练多个模型&…

重磅来袭:复旦团队发布国内首个类 ChatGPT 模型 MOSS,邀公众参与内测!

前言 ChatGPT发布以来,基于指令学习技术的类ChatGPT模型在我国能否开发成功,成为业界关注的一个焦点。今天,从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(htt…

聚观早报 | 科大讯飞称10月整体赶超ChatGPT;苹果遭欧盟警告

今日要闻:科大讯飞称10月整体赶超ChatGPT;苹果遭欧盟警告;科研人员研发纳米粒子治疗癌症;中小学教材不得夹带商业广告;Z-Library又被美国FBI查封了 科大讯飞称10月整体赶超ChatGPT 5 月 6 日,科大讯飞董事…

不得不说,关于分子对接,MOE有点牛!

来源公众号:计算机辅助药物设计 CADD MOE软件的虚拟仿真实验 多奈哌齐与乙酰胆碱酯酶的分子对接 本文基于MOE软件设计了多奈哌齐与乙酰胆碱酯酶的分子对接虚拟仿真实验。 通过分子结构预处理、分子对接以及数据分析等内容&#…

打脸质疑者!Mobileye市值冲高,公司CEO说出心声

三个多月前, Mobileye以21美元发行价第二次在美股IPO上市。截止上周五,该公司股价升至32.98美元,市值达到264.47亿美元。相比于美股其他自动驾驶公司股价跌跌不休,显然,资本市场更看重企业的盈利能力和可预见的营收规模…

科技公司 CEO 合谋“诈骗”自家公司超 900 万美元,现已被捕

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 虽然一直都知道许多 CEO 实际上并不能随意设定自己的薪酬,但还真没见过 CEO 为了赚钱“诈骗”自家公司的! 本周三,美国纽约南区地方法院和联邦调查局宣布已逮捕并起…

【论文阅读】Multimodal Fusion with Co-Attention Networks for Fake News Detection --- 虚假新闻检测,多模态融合

本博客系本人理解该论文之后所写,非逐句翻译,预知该论文详情,请参阅论文原文。 论文标题:Multimodal Fusion with Co-Attention Networks for Fake News Detection; 作者:Yang Wu, Pengwei Zhan, Yunjian…

多维考察ChatGPT

2022年11月30日,OpenAI正式发布了一款聊天机器人ChatGPT,它不仅会聊天,还会编写代码、撰写文案、代写论文、即时翻译……一时让人分不清这是“作业神器”,还是“竞业凶器”。不管你爱它还是恨它,都不能无视它。在商业上…

「国际科技信息中心SCITIC论坛」从ChatGPT、流浪地球、虚拟数字人、AIGC探索数字化创意,展望人类与AI的共创...

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2023年2月24日,由国际科技信息中心主办,AI TIME承办的SCITIC论坛——数字化创意探索,从流浪地球说起完美收官。SCITIC论坛由国际科技信息中心倾力打造,围绕深圳“…

ChatGPT 生成Mysql学生表,课程表与成绩表并插入测试数据

想学习SQL语句,又不想自己创建表,也不想造数据,这个时候ChatGPT可以一键帮我们做好。 我们可以将SQL 语句复制出来。 -- 创建学生表 CREATE TABLE students (id INT(11) NOT NULL AUTO_INCREMENT,name VARCHAR(50) NOT NULL,gender ENUM(男, 女) NOT NULL,age INT(3) NOT N…

【ChatGpt变形计】| 让使用变得更加便利 | 随笔

🦁 狮子有话说 ChatGpt是一款基于人工智能技术的聊天机器人,可以通过自然语言的方式与用户进行交互。它不仅可以回答用户的问题,还可以进行智能对话,甚至可以进行情感分析,让用户感受到更真实的人性化交互。无论你是想…

动动嘴就能喝上咖啡,ChatGPT做到了

当ChatGPT接管咖啡吧后,会发生什么呢?让我们来看看吧! 众所周知,打工人不能失去咖啡。然而,不论是点外卖还是自己做,都需要耗费不少的时间。如果,只要我说一句: “我要喝咖啡&#x…

[ChatGPT]Open AI开放ChatGPT模型API,允许第三方开发人员将其集成到自己的应用和服务中

ChatGPT大事件 3月2日,Open AI在官方博客宣布,开放了ChatGPT和Whisper的模型API,用户可将其集成在应用程序等产品中。 注意, Open AI开放的是ChatGPT模型的API。也就是说,企业、个人开发者都能使用目前最强大的模型之…