澜舟科技成立两周年|“孟子GPT”大模型开启邀测

2023年6月10日,澜舟科技迎来了成立两周年的纪念日。回首过去的两年,无惧诸多挑战和困难,我们始终坚持信念和目标,并取得了一系列瞩目的成绩。在此,我们要特别感谢一直支持和信赖我们的投资方们:创新工场、联想创投、斯道资本和中关村科学城公司

澜舟科技是国内最早开始从事大模型创业的团队之一。创始人周明博士离开工作了21年的微软,于2020年底加入李开复博士的创新工场孵化团队,领导大模型创业,致力于成为世界上最强的 NLP 技术团队并把研发的技术赋能企业,促进企业的数字化和智能化。凭借着先发优势,澜舟科技在今年3月份完成了Pre-A+轮融资。此次融资由中关村科学城公司领投,斯道资本和创新工场跟投。在此要感谢北京市海淀区政府、中关村科学城给予澜舟的大力支持,另外澜舟科技的成长与李开复博士和创新工场的鼎力支持密不可分,我们也要向他们表示最诚挚的感谢。

建立合作伙伴关系是企业技术实力的有力证明。早在去年9月份,澜舟科技就与中文在线在AIGC领域展开合作。今年,双方进一步加强战略协作,共探 AIGC 技术在漫画、动画、视频等 IP 衍生业务领域的新型内容生产方式;今年3月份澜舟科技与创新奇携手,充分利用各自优势,探索AIGC技术在制造行业的落地实施;5月份联合引力传媒,布局媒体行业,共建“行业 AIGC 大模型联合实验室”,赋能内容创作者、商户和企业级客户等市场多元需求。值此两周年之际,我们向始终支持和帮助澜舟科技成长的合作伙伴表示衷心感谢,同时也非常感谢在创业孵化之初便给予澜舟科技支持和帮助的合作伙伴:知乎、传神语联、华为云、数说故事、同花顺、云从科技和华夏基金等。

如今,澜舟科技在基于孟子轻量化预训练模型的文本生成、机器翻译、行业搜索等应用实践,以及孟子GPT生成式大模型领域均取得了显著的成就。截至目前,澜舟科技已收获20多项大模型技术专利和3项软著。孟子预训练模型屡次荣登CLUE、ZeroCLUE和FewCLUE榜单,并成功入选「2021科创中国年度优秀开源产品50强」。在备受国际认可的HICOOL2021全球创业大赛中,孟子新一代认知服务引擎从众多全球项目中脱颖而出,荣获一等奖。澜舟科技“可控文本生成引擎在文案辅助写作上的应用”在 AIIA 组织的大规模预训练模型应用案例评选中,入选“2022大规模预训练模型优秀应用案例”,在创新性和实践应用上获得一致认可。此外,无论是澜舟科技还是其技术产品在机器之心、量子位、甲子光年等知名媒体年度评选中均榜上有名。国际上,近日被评选为2023达沃斯世界经济论坛新锐科技创业企业(WEF Technology Pioneer) , 以及进入硅谷科技媒体《The Information》盘点中国对标OpenAI的AI初创企业Top 5。

01 孟子GPT通用大模型是坚实底座

核心技术是企业发展的基本要素,澜舟科技创立之初就开始做大模型。基于团队自研的大规模预训练语言模型-孟子预训练模型,可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。

孟子通用预训练模型自2021年4月问世,基于孟子预训练模型的营销文案引擎和金融领域模型短时间便落地业务场景,为企业提供AI能力服务。两年间,澜舟科技积极探索大模型技术的应用和发展,坚持技术积累和业务验证,完成孟子大模型系列品牌建设。今年3月份,澜舟科技也正式推出了孟子GPT生成式大模型和基于孟子GPT的AI对话机器人- MChat,值此两周年纪念日,孟子GPT也开启邀测(详情见下文)!

图片

02 孟子大模型专注垂直领域、专业赛道

孟子GPT大模型在ToB落地路径上分为了L1、L2、L3三个层次:

图片

L1-孟子通用大模型底座

孟子通用大模型底座提供的是通用大模型的语言理解、多轮对话等基本能力。目前百亿级参数量的模型已经稳定,现在开启对外邀测。澜舟还将陆续推出500亿上下和1000亿上下的通用大模型和行业大模型,为各体量、各行业的客户提升价值。

那在众多涌现出来的大模型中,孟子GPT在其中的表现力又如何呢?同样,对比目前常见的几种大模型我们一起来看看:

图片

澜舟科技自发测试

从具体实例再来看看:

在文本生成方面:

图片

图片

图片

图片

在营销文案写作方面:

图片

图片

图片

图片

在金融场景任务方面:

图片

图片

图片

图片

在多语种翻译方面:

图片

图片

图片

图片

经过对比分析,孟子大模型在以上各项任务中均表现良好。对阵千亿级大模型,百亿参数量的孟子GPT可以说毫不逊色。

L2-孟子行业或者领域大模型

除了不断加强孟子通用大模型能力和性能之外,澜舟科技基于孟子通用大模型,推出了行业大模型路线,针对行业特点深耕,深入企业原有生态和业务场景,最大化利用行业数据,将其融入到大模型中进行训练。目前已成功落地金融、文娱、营销、翻译等行业场景,为企业提供定制化、全方位、一站式的智能解决方案。这一层澜舟也会充分和行业伙伴合作,共同打造更多行业大模型。

金融大模型为例,国内外很多研究成果表明,行业领域知识是提高行业任务性能的关键。针对金融任务,利用高质量金融领域数据和任务训练的模型,比同等级别参数的通用模型性能更优,甚至更少参数量的金融模型可以取得比更多参数量的通用模型更优的性能。

孟子金融大模型采用更多金融领域的数据进行自监督训练,同时通过模型标注和人工标注的方法构建了数百万条涵盖金融下游任务的指令训练数据,从语言理解到语言生成,涵盖实体识别、情感分析、信息抽取、文本理解、文本生成、文本翻译、智能对话、智能问答等多个方面。同时采用 Few-shot 训练和测试,泛化能力强,可支持众多面向金融场景的应用。

图片

在众多金融场景任务上的评测表明,孟子金融大模型,通过构建覆盖众多金融任务的数据,以及Few-shot训练及强化学习等训练方法,在金融任务上整体能取得更优性能。

图片

具体到业务应用中,孟子金融大模型的表现能力如何?接下来会通过多样化的实例来进行展示:

图片

图片

图片

L3-面向场景的任务模型

这一层会面向客户实际的业务场景,例如金融行业的研报观点提取、新闻资讯摘要生成、网文的续写、营销文案生成等, 会通过提示工程或者微调来实现相关的任务,相对于L1-L2会更加敏捷。即将发布的“澜舟智会”-金融音视频会议分析产品也是基于这样的L3面向场景任务模型来实现的。

澜舟智会 - 金融视频会议分析平台即将发布!

澜舟智会是一款基于孟子GPT大模型打造的基于L3层面向场景任务模型的应用型产品。金融行业用户日常会有大量的视频/电话会议信息输入,如:业绩汇报、卖方路演、专家会议、公司交流、买方观点等, 澜舟智会能够帮助金融行业用户提高处理音视频会议效率,提供文字转录、要点总结、搜索与问答、生成会议纪要、话题聚合等功能。

图片

(页面功能示意图)

澜舟智会能做什么:

  • 全文摘要及关键问答提炼:在海量信息中准确捕获核心要点,借助孟子大模型可以高效地分析会议内容,为您提取并生成准确、直观的全文摘要,同时提炼出关键问答。帮助您轻松掌握会议重点,确保每个决策都建立在准确、全面的信息基础之上。

  • 会议要点智能导航:根据会议内容自动提炼出关键要点,形成智能会议导航。无论会议内容有多长,都能帮助您快速定位到重要信息,直接找到您最关心的部分。让会议内容不再复杂繁琐,而是清晰、精准。

  • 全文语义搜索和问答:借助孟子大模型实现的全文语义搜索和问答功能,您可以轻松精确地定位到会议记录中的关键内容。不仅可以针对具体词汇进行搜索,还能理解问题的语义,为您提供最相关的答案。让信息的查找和提问更加智能。

  • 大模型优化的语音转录:采用孟子大模型技术理解和优化语音识别的结果,识别和纠正口语表达中的非标准语法和用词。在保留全部信息的前提下精简冗余的文字,极大地提高了文本的可读性,让您能够更快更准确地捕捉到关键信息。

  • 多维度信息抽取分析能力:具备高效精准的信息抽取分析能力,不仅能够特定地抽取出会议中的数字信息、关键话题以及公司或行业相关信息,更能进行句子级的会议内容情感分析。

除此之外,我们也针对业务和技术深度结合的场景提供可定制化的解决方案。

孟子GPT生成式大模型开启邀测

孟子生成式大模型(孟子GPT)于3月份正式推出,5月初开始百亿参数量的模型对外定向邀请测试,获得了众多关注和正面的评价,为测试用户提供了SOTA的聊天、问答、对话、写作、翻译等功能。目前,经过近一个月的迭代、优化和测试,孟子GPT的性能与功能已趋于成熟。

扫描下方图片中二维码即可申请体验 (目前邀测每天会有一定限额,我们会根据行业和需求场景来审核通过):

图片

网页体验及API服务申请地址:https://www.langboat.com/portal/mengzi-gpt

本地化部署需求请提交合作咨询。

孟子生成式大模型(孟子 GPT)是一个面向生成场景的可控大语言模型,能够通过多轮的方式帮助用户完成特定场景中的多种工作任务,如:

  • 知识问答:通过问答的方式帮助用户直接获取所需要的信息,无需再做搜索和筛选。

  • 多语言翻译:在对话中实现多语言的翻译,相比传统翻译效果更加流畅自然。

  • 通用写作:能够按照用户的要求撰写多种类型、题材的文章,并通过自然语言对话来控制内容创作的效果。

  • 金融场景任务:针对金融场景的特殊任务进行模型优化,例如财经新闻摘要、行业标签抽取、观点总结、情绪分析等,帮助行业工作者能够更高效的完成工作。

它的技术优势在于:

  • 更可控:实现类ChatGPT的对话能力的同时加入诸多安全可控的功能引擎。

  • 更灵活:支持不同参数量规模的迁移学习,让客户可以量体裁衣,按需投入资源进行继续训练。

  • 更个性:根据不同业务场景和用户需求进行对话效果定制,实现个性化的对话服务。

  • 更专业:更好的融合行业数据、知识图谱和实时检索的行业大模型。

03 结束语

我们身处一个科技日新月异的时代,值此澜舟科技成立两年之际, 我们看到:

大模型带来了认知智能技术跨越式发展。从AI大模型1.0到2.0,从简单能力+针对具体任务的专用模型,到复杂能力+面向泛任务的通用模型,推动着语言理解、多轮对话、问题求解进入了基本可用时代。有效解决NLP任务碎片化问题,大幅度提高研发效率,标志着NLP进入工业化可实施阶段。

大模型带来了个人和企业工作的新范式。个人从内容创作、办公、搜索和人机交互,都将被深深变革。金融领域智能客服、营销、风控、投研、推荐等各个方面降本增效。在企业服务方面提升人力、财务、营销、获客、调研、报告生成等方面生产率,有效改善客户满意度,实现智能决策,提高工作效率,提升企业形象和市场竞争力。

未来在大模型带动下,从AI 1.0到AI 2.0,将不断走向AGI。实现负责任的、安全可控的、功能强大的通用大模型和功能引擎。知识、常识、可解释、自学习、动态接入各类动态和静态数据。大模型将成为认知智能的基础模型,通过云计算、本地部署和端,成为各项服务的内在中枢和各类计算机软硬件系统的泛在人机接口。

未来,澜舟科技将继续致力于创新和优化孟子大模型的性能和功能,为用户提供更加灵活、智能化的解决方案,满足不同行业和场景下的需求。澜舟作为一家大模型公司,在过去两年中已经取得了优异的成绩,在未来的发展中还需从如下几个方面进行努力和改进:

一、继续加强大模型研究:

  • 继续深入探索大模型的技术和理论,开展前沿研究和创新性探索。

  • 不断优化算法和架构设计,提升模型的性能和效率。

  • 推进与其他学科领域的交叉融合,打造具有更高综合性的大模型。

二、行业落地方面:

  • 积极探索大模型在各行各业的应用,加强与产业链上下游的合作,加速落地。

  • 针对特定行业的需求,定制化开发相关的大模型解决方案,提高行业应用的效果和效益。

  • 构建开放的合作生态,与合作伙伴共同推动大模型在各个行业的推广和应用。

三、对外合作方面:

  • 加强与国内外知名高校和企业的交流与合作,共同推动全球范围内的大模型研究和应用。

  • 积极参与国际学术会议和论坛,分享大模型的研究和应用成果,促进国际间的学术交流和合作。

四、人才培养方面:

  • 加大人才引进和培养力度,吸引优秀的研究人员和技术人员加入团队。

  • 提供全面的培训和职业发展机会,帮助员工提升技能和能力。

不积跬步,无以至千里;

不积小流,无以成江海。

行动远比计划更务实。

最后,感谢各位关注澜舟科技发展和成长, 让我们一起祝福澜舟科技两周年快乐!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62220.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-4 开启 “软件工程3.0” 全新时代

文章最早发表于我自己个人公众号 软件质量报道 希望这篇文章 成为 “软件工程3.0” 开创性的宣言。 为了定义 “软件工程3.0”,让我们先定义 “软件工程1.0”、 “软件工程2.0” 。先简单说明一下,用软件版本号的方式 “1.0、2.0、3.0” 来分别定义第一代…

国内首个低代码结合GPTChat实现AI自动建模与图形化编程

一、AI时代来势汹汹 整个3月,互联网行业似乎已经感受到了一股新的力量正在崛起,以ChatGPT为代表的AIGC势力,正在以风起云涌之势快速登场。 从OpenAI放出ChatGPT-4的模型短短一周内,Google、微软相继也召开了自己的发布会推出了自…

CSDN创始人蒋涛出席2021 中关村论坛,启动“科创中国”开源创新榜单评选

近日,2021中关村论坛–开源创新发展论坛在北京中关村成功举办。论坛由中国科学技术协会、北京市人民政府共同主办。论坛上,“科创中国”开源创新联合体副秘书长、CSDN创始人&董事长蒋涛正式启动了开源创新榜单评选活动,并参与了“中国开源…

硅基仿生业务全面 Serverless 容器化,14万+问答库助力糖尿病科普

作者:宁佑章(硅基仿生科技)、元毅(阿里云容器服务) “使用阿里云容器服务 Knative,解决了开发迭代慢的问题,加速了深度学习模型的性能提升;同时提供了弹性可伸缩的资源配置&#xf…

地球生命为啥只选择碳基生命,而不是硅基生命呢?

相关文章 人人都是人生顿悟者,不惑知天命- 人和需求篇 人的意义_个人渣记录仅为自己搜索用的博客-CSDN博客 什么是科学 人人都是价值观-思辨专家_个人渣记录仅为自己搜索用的博客-CSDN博客 作者:程亦之 链接:https://zhuanlan.zhihu.com/p/27534210 来…

《硅基物语.AI大爆炸》——AIC松鼠活动第四期

简介: 一个 AI 的自白,以第一人称视角,通俗易懂地讲述 AI 的来龙去脉,生动活泼地表达 AI 的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学&#xf…

【2021-12-04】小红书x-sign逆向分析记录

改版了 ,失效了 此次研究的是小红书小程序版本,通过抓包工具fiddler可以获得它有一个加密参数x-sign: 从长度可以看出来,是一个md5加密,authorization是一个账号凭证,具有唯一性,User-Agent需要使用小程序版本的UA,以下是本人自己收集的UA,仅供参考: M…

实操指南|如何通过大数据助力小红书爆文打造?

前言 上篇关于品牌种草如何挑选优质达人的文章发布后,公众号后台很多品牌方留言,达人我们选好了,达人的笔记内容该如何写呢?如何才能让所选的达人写的笔记成为爆文,获得平台更多的流量推荐?互动量达到多少…

小红书很难爬?最新爬取方法教给你啦~

点击上方“Python爬虫与数据挖掘”,进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书 今日鸡汤莫学武陵人,暂游桃源里。Python进击者 第184篇原创文章前言 大家好,我是Kuls。 之前写的那篇App抓包软件charles的配置说过&#xff…

CSDN网站个性化推荐功能测试

本博客是为了完成这个找 bug 号召: https://bbs.csdn.net/topics/614134877而发布的。 我的测试环境是:Microsoft Edge 114.0.1823.43 (正式版本)(64位)非无痕模式 测试场景之一:兴趣标签 场景1.1 添加兴…

黄仁勋:英伟达收购 ARM 是谣言,下周发布会有惊喜

By 超神经 内容提要:近期,英伟达发布了第二季度财报,业绩喜人,再创新高。公司 CEO 黄仁勋随后还接受了 Venturebeat 旗下游戏频道 Gamesbeat 的记者采访,就英伟达目前现状、游戏行业发展等发表了自己的见解。 关键词&a…

英伟达真假黄仁勋疑云

作者 | 祝涛 出品 | CSDN(ID:CSDNnews) 近日,在计算机图形顶级会议ACM SIGGRAPH 2021上,英伟达介绍了公司研发的3D仿真模拟和协作平台Omniverse,并详细解释了数字假人黄仁勋的打造过程。难道英伟达今年4月…

真假黄仁勋疑云?英伟达推出全球首个元宇宙平台

【编者按】近日,在计算机图形顶级会议ACM SIGGRAPH 2021上,英伟达介绍了公司研发的3D仿真模拟和协作平台Omniverse,并详细解释了数字假人黄仁勋的打造过程。难道英伟达今年4月的主题演讲是由“假黄仁勋”主持的?对此,英…

英伟达国内版 A800 来袭,为了赚钱黄教主拼尽全力!

近来,英伟达推出专供中国市场使用的A800系列显卡。作为A100的替代,A800符合美国政府对减少出口管制的明确测试,并且不能通过编程来实现性能超越。 另辟蹊径:没有A100,但可以有A800 ​美国对中国进行核心技术防备也不…

英伟达发大招 黄仁勋:生成式AI唯一限制是人类想象力

雷递网 雷建平 3月22日 ChatGPT仅是一个起点。 英伟达(NVIDIA)创始人兼首席执行官黄仁勋说,计算正在以“光速”发展。黄仁勋于今日宣布与谷歌、微软、Oracle等一众领军企业开展广泛的合作,为各行各业带来新的AI、模拟和协作能力。…

英伟达曝光超级芯片 黄仁勋:AI已重塑计算机产业

5月29日,英伟达再曝新品“NVIDIA DGX™超级计算机”,为生成式AI语言应用、推荐系统和数据分析工作负载的巨型模型提供硬件支持。 该计算机的核心组件是已经全面投产的英伟达Grace Hopper超级芯片——2000 亿个晶体管,在同一封装内集成了72核…

黄仁勋误入直播被当“路人”,英伟达粉丝都乐疯了

作者|李禾子 邮箱|lihezipingwest.com 黄仁勋,大名鼎鼎的芯片巨头英伟达CEO,硅谷最炙手可热的男人,最近出现在了台北街头两个女主播的直播间里。 不是宣传产品,不是接受访问,而是纯纯地路过被…

谷歌开源Live Transcribe语音识别转文字工具

8月18日,Google宣布开源Android语音识别转录工具Live Transcribe的语音引擎。 这家公司希望这样做可以让任何开发人员为长篇对话提供字幕,减少因网络延迟、断网等问题导致的沟通障碍。源代码现在可以在GitHub上获得。这意味着无论你是出国或是与新朋友见…

python简单实现文字转语音,语音识别

直接语音合成 需要安装 pip3 install pyttsx3 pip3 install pypiwin32 安装pyttsx3的时候出错,结果重装了一次python才行。。。 tips:最后本人安装的版本是3.6 import pyttsx3 # 初始化 engine pyttsx3.init()engine.say(我要开始语音合成) engine.say(好好学习&am…

语音识别(语音转文字) 语音合成(文字转语音)

【语音合成API】SpeechSynthesisUtterance是HTML5中新增的API,用于将指定文字合成为对应的语音.也包含一些配置项,指定如何去阅读(语言,音量,音调)等 // 语音播报speek (content) {let message new SpeechSynthesisUtterance()message.text contentmessage.lang zh-CNmessag…