2023年6月10日,澜舟科技迎来了成立两周年的纪念日。回首过去的两年,无惧诸多挑战和困难,我们始终坚持信念和目标,并取得了一系列瞩目的成绩。在此,我们要特别感谢一直支持和信赖我们的投资方们:创新工场、联想创投、斯道资本和中关村科学城公司。
澜舟科技是国内最早开始从事大模型创业的团队之一。创始人周明博士离开工作了21年的微软,于2020年底加入李开复博士的创新工场孵化团队,领导大模型创业,致力于成为世界上最强的 NLP 技术团队并把研发的技术赋能企业,促进企业的数字化和智能化。凭借着先发优势,澜舟科技在今年3月份完成了Pre-A+轮融资。此次融资由中关村科学城公司领投,斯道资本和创新工场跟投。在此要感谢北京市海淀区政府、中关村科学城给予澜舟的大力支持,另外澜舟科技的成长与李开复博士和创新工场的鼎力支持密不可分,我们也要向他们表示最诚挚的感谢。
建立合作伙伴关系是企业技术实力的有力证明。早在去年9月份,澜舟科技就与中文在线在AIGC领域展开合作。今年,双方进一步加强战略协作,共探 AIGC 技术在漫画、动画、视频等 IP 衍生业务领域的新型内容生产方式;今年3月份澜舟科技与创新奇智携手,充分利用各自优势,探索AIGC技术在制造行业的落地实施;5月份联合引力传媒,布局媒体行业,共建“行业 AIGC 大模型联合实验室”,赋能内容创作者、商户和企业级客户等市场多元需求。值此两周年之际,我们向始终支持和帮助澜舟科技成长的合作伙伴表示衷心感谢,同时也非常感谢在创业孵化之初便给予澜舟科技支持和帮助的合作伙伴:知乎、传神语联、华为云、数说故事、同花顺、云从科技和华夏基金等。
如今,澜舟科技在基于孟子轻量化预训练模型的文本生成、机器翻译、行业搜索等应用实践,以及孟子GPT生成式大模型领域均取得了显著的成就。截至目前,澜舟科技已收获20多项大模型技术专利和3项软著。孟子预训练模型屡次荣登CLUE、ZeroCLUE和FewCLUE榜单,并成功入选「2021科创中国年度优秀开源产品50强」。在备受国际认可的HICOOL2021全球创业大赛中,孟子新一代认知服务引擎从众多全球项目中脱颖而出,荣获一等奖。澜舟科技“可控文本生成引擎在文案辅助写作上的应用”在 AIIA 组织的大规模预训练模型应用案例评选中,入选“2022大规模预训练模型优秀应用案例”,在创新性和实践应用上获得一致认可。此外,无论是澜舟科技还是其技术产品在机器之心、量子位、甲子光年等知名媒体年度评选中均榜上有名。国际上,近日被评选为2023达沃斯世界经济论坛新锐科技创业企业(WEF Technology Pioneer) , 以及进入硅谷科技媒体《The Information》盘点中国对标OpenAI的AI初创企业Top 5。
01 孟子GPT通用大模型是坚实底座
核心技术是企业发展的基本要素,澜舟科技创立之初就开始做大模型。基于团队自研的大规模预训练语言模型-孟子预训练模型,可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。
孟子通用预训练模型自2021年4月问世,基于孟子预训练模型的营销文案引擎和金融领域模型短时间便落地业务场景,为企业提供AI能力服务。两年间,澜舟科技积极探索大模型技术的应用和发展,坚持技术积累和业务验证,完成孟子大模型系列品牌建设。今年3月份,澜舟科技也正式推出了孟子GPT生成式大模型和基于孟子GPT的AI对话机器人- MChat,值此两周年纪念日,孟子GPT也开启邀测(详情见下文)!
02 孟子大模型专注垂直领域、专业赛道
孟子GPT大模型在ToB落地路径上分为了L1、L2、L3三个层次:
L1-孟子通用大模型底座
孟子通用大模型底座提供的是通用大模型的语言理解、多轮对话等基本能力。目前百亿级参数量的模型已经稳定,现在开启对外邀测。澜舟还将陆续推出500亿上下和1000亿上下的通用大模型和行业大模型,为各体量、各行业的客户提升价值。
那在众多涌现出来的大模型中,孟子GPT在其中的表现力又如何呢?同样,对比目前常见的几种大模型我们一起来看看:
澜舟科技自发测试
从具体实例再来看看:
在文本生成方面:
在营销文案写作方面:
在金融场景任务方面:
在多语种翻译方面:
经过对比分析,孟子大模型在以上各项任务中均表现良好。对阵千亿级大模型,百亿参数量的孟子GPT可以说毫不逊色。
L2-孟子行业或者领域大模型
除了不断加强孟子通用大模型能力和性能之外,澜舟科技基于孟子通用大模型,推出了行业大模型路线,针对行业特点深耕,深入企业原有生态和业务场景,最大化利用行业数据,将其融入到大模型中进行训练。目前已成功落地金融、文娱、营销、翻译等行业场景,为企业提供定制化、全方位、一站式的智能解决方案。这一层澜舟也会充分和行业伙伴合作,共同打造更多行业大模型。
以金融大模型为例,国内外很多研究成果表明,行业领域知识是提高行业任务性能的关键。针对金融任务,利用高质量金融领域数据和任务训练的模型,比同等级别参数的通用模型性能更优,甚至更少参数量的金融模型可以取得比更多参数量的通用模型更优的性能。
孟子金融大模型采用更多金融领域的数据进行自监督训练,同时通过模型标注和人工标注的方法构建了数百万条涵盖金融下游任务的指令训练数据,从语言理解到语言生成,涵盖实体识别、情感分析、信息抽取、文本理解、文本生成、文本翻译、智能对话、智能问答等多个方面。同时采用 Few-shot 训练和测试,泛化能力强,可支持众多面向金融场景的应用。
在众多金融场景任务上的评测表明,孟子金融大模型,通过构建覆盖众多金融任务的数据,以及Few-shot训练及强化学习等训练方法,在金融任务上整体能取得更优性能。
具体到业务应用中,孟子金融大模型的表现能力如何?接下来会通过多样化的实例来进行展示:
L3-面向场景的任务模型
这一层会面向客户实际的业务场景,例如金融行业的研报观点提取、新闻资讯摘要生成、网文的续写、营销文案生成等, 会通过提示工程或者微调来实现相关的任务,相对于L1-L2会更加敏捷。即将发布的“澜舟智会”-金融音视频会议分析产品也是基于这样的L3面向场景任务模型来实现的。
澜舟智会 - 金融视频会议分析平台即将发布!
澜舟智会是一款基于孟子GPT大模型打造的基于L3层面向场景任务模型的应用型产品。金融行业用户日常会有大量的视频/电话会议信息输入,如:业绩汇报、卖方路演、专家会议、公司交流、买方观点等, 澜舟智会能够帮助金融行业用户提高处理音视频会议效率,提供文字转录、要点总结、搜索与问答、生成会议纪要、话题聚合等功能。
(页面功能示意图)
澜舟智会能做什么:
-
全文摘要及关键问答提炼:在海量信息中准确捕获核心要点,借助孟子大模型可以高效地分析会议内容,为您提取并生成准确、直观的全文摘要,同时提炼出关键问答。帮助您轻松掌握会议重点,确保每个决策都建立在准确、全面的信息基础之上。
-
会议要点智能导航:根据会议内容自动提炼出关键要点,形成智能会议导航。无论会议内容有多长,都能帮助您快速定位到重要信息,直接找到您最关心的部分。让会议内容不再复杂繁琐,而是清晰、精准。
-
全文语义搜索和问答:借助孟子大模型实现的全文语义搜索和问答功能,您可以轻松精确地定位到会议记录中的关键内容。不仅可以针对具体词汇进行搜索,还能理解问题的语义,为您提供最相关的答案。让信息的查找和提问更加智能。
-
大模型优化的语音转录:采用孟子大模型技术理解和优化语音识别的结果,识别和纠正口语表达中的非标准语法和用词。在保留全部信息的前提下精简冗余的文字,极大地提高了文本的可读性,让您能够更快更准确地捕捉到关键信息。
-
多维度信息抽取分析能力:具备高效精准的信息抽取分析能力,不仅能够特定地抽取出会议中的数字信息、关键话题以及公司或行业相关信息,更能进行句子级的会议内容情感分析。
除此之外,我们也针对业务和技术深度结合的场景提供可定制化的解决方案。
孟子GPT生成式大模型开启邀测
孟子生成式大模型(孟子GPT)于3月份正式推出,5月初开始百亿参数量的模型对外定向邀请测试,获得了众多关注和正面的评价,为测试用户提供了SOTA的聊天、问答、对话、写作、翻译等功能。目前,经过近一个月的迭代、优化和测试,孟子GPT的性能与功能已趋于成熟。
扫描下方图片中二维码即可申请体验 (目前邀测每天会有一定限额,我们会根据行业和需求场景来审核通过):
网页体验及API服务申请地址:https://www.langboat.com/portal/mengzi-gpt
本地化部署需求请提交合作咨询。
孟子生成式大模型(孟子 GPT)是一个面向生成场景的可控大语言模型,能够通过多轮的方式帮助用户完成特定场景中的多种工作任务,如:
-
知识问答:通过问答的方式帮助用户直接获取所需要的信息,无需再做搜索和筛选。
-
多语言翻译:在对话中实现多语言的翻译,相比传统翻译效果更加流畅自然。
-
通用写作:能够按照用户的要求撰写多种类型、题材的文章,并通过自然语言对话来控制内容创作的效果。
-
金融场景任务:针对金融场景的特殊任务进行模型优化,例如财经新闻摘要、行业标签抽取、观点总结、情绪分析等,帮助行业工作者能够更高效的完成工作。
它的技术优势在于:
-
更可控:实现类ChatGPT的对话能力的同时加入诸多安全可控的功能引擎。
-
更灵活:支持不同参数量规模的迁移学习,让客户可以量体裁衣,按需投入资源进行继续训练。
-
更个性:根据不同业务场景和用户需求进行对话效果定制,实现个性化的对话服务。
-
更专业:更好的融合行业数据、知识图谱和实时检索的行业大模型。
03 结束语
我们身处一个科技日新月异的时代,值此澜舟科技成立两年之际, 我们看到:
大模型带来了认知智能技术跨越式发展。从AI大模型1.0到2.0,从简单能力+针对具体任务的专用模型,到复杂能力+面向泛任务的通用模型,推动着语言理解、多轮对话、问题求解进入了基本可用时代。有效解决NLP任务碎片化问题,大幅度提高研发效率,标志着NLP进入工业化可实施阶段。
大模型带来了个人和企业工作的新范式。个人从内容创作、办公、搜索和人机交互,都将被深深变革。金融领域智能客服、营销、风控、投研、推荐等各个方面降本增效。在企业服务方面提升人力、财务、营销、获客、调研、报告生成等方面生产率,有效改善客户满意度,实现智能决策,提高工作效率,提升企业形象和市场竞争力。
未来在大模型带动下,从AI 1.0到AI 2.0,将不断走向AGI。实现负责任的、安全可控的、功能强大的通用大模型和功能引擎。知识、常识、可解释、自学习、动态接入各类动态和静态数据。大模型将成为认知智能的基础模型,通过云计算、本地部署和端,成为各项服务的内在中枢和各类计算机软硬件系统的泛在人机接口。
未来,澜舟科技将继续致力于创新和优化孟子大模型的性能和功能,为用户提供更加灵活、智能化的解决方案,满足不同行业和场景下的需求。澜舟作为一家大模型公司,在过去两年中已经取得了优异的成绩,在未来的发展中还需从如下几个方面进行努力和改进:
一、继续加强大模型研究:
-
继续深入探索大模型的技术和理论,开展前沿研究和创新性探索。
-
不断优化算法和架构设计,提升模型的性能和效率。
-
推进与其他学科领域的交叉融合,打造具有更高综合性的大模型。
二、行业落地方面:
-
积极探索大模型在各行各业的应用,加强与产业链上下游的合作,加速落地。
-
针对特定行业的需求,定制化开发相关的大模型解决方案,提高行业应用的效果和效益。
-
构建开放的合作生态,与合作伙伴共同推动大模型在各个行业的推广和应用。
三、对外合作方面:
-
加强与国内外知名高校和企业的交流与合作,共同推动全球范围内的大模型研究和应用。
-
积极参与国际学术会议和论坛,分享大模型的研究和应用成果,促进国际间的学术交流和合作。
四、人才培养方面:
-
加大人才引进和培养力度,吸引优秀的研究人员和技术人员加入团队。
-
提供全面的培训和职业发展机会,帮助员工提升技能和能力。
不积跬步,无以至千里;
不积小流,无以成江海。
行动远比计划更务实。
最后,感谢各位关注澜舟科技发展和成长, 让我们一起祝福澜舟科技两周年快乐!