盘点国内热门AI大模型

Chat-GPT问世以来,使得大模型一时间内火爆非凡。国内外各大科技公司也纷纷加入到大模型的研发行列中来,“百模之战”愈演愈烈,国内百度、阿里、华为等科技大厂陆续推出旗下大模型产品,新锐科技公司也不甘落后,目前不少产品已经进入内测阶段。本文就来对国内部分AI大模型产品做个简单的集锦综述。

1.百度——文心一言

文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够进行对话互动、文本翻译、问题回答,高效便捷地帮助人们获取知识信息。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色 。

文心一言不仅能够生成文字,还能够生成图片、音频、视频等多种形式的内容 。以百度自研的跨模态大模型ERNIE-ViLG为底层架构,进而能够实现从文字到图像、从图像到文字、从声音到图像等多种转换 。用户通过简单的文字描述,文心一言便可通过相应的指令来图画、LOGO或者视频的产出,具有多模态生成能力。

2.阿里——通义千问

通义千问,是阿里云推出的一个超大规模的语言模型,可以进行多轮对话、文案创作、还具备逻辑推理、多模态理解、多语言支持的能力。通义千问以阿里巴巴达摩院自主研发的大规模分布式计算平台为架构,包括含光800、云计算平台等。在硬件设备方面,使用的是阿里自主研发的高性能计算芯片“含光800”。

通义千问能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。除了基本的文本生成和问答能力,还支持更多的定制化需求,可以针对不同场景和应用进行扩展和定制,提供更加个性化的服务和解决方案。

3.华为——盘古

盘古大模型是华为旗下开发的一系列AI大模型,首次基于「鹏城云脑 Ⅱ」和全场景 AI 计算框架 MindSpore 的自动混合并行模式实现在 2048卡算力集群上的大规模分布式训练,是国产全栈式 AI 基础设施第一次支持 2000 亿级超大规模语言模型训练,探索并验证了国产 E 级智算平台在软硬件协同优化、大规模分布式并行训练等核心关键技术上的可行性。

在模型性能方面,鹏程. 盘古大模型性能全球领先,16 个下游任务中性能指标优于业界 SOTA 模型,其中零样本学习任务 11 个任务领先、单样本学习任务 12 个任务领先、小样本学习任务 13 个任务领先。目前对于网传的“盘古Chat”并没有官方准确消息,但据悉2023华为开发者大会(HDC)将于7月7日在东莞召开,AI将会是本次大会的主线。 ​

4.科大讯飞——星火认知大模型

讯飞星火认知大模型是由讯飞人工智能实验室于2021年9月发布的中文自然语言处理全栈平台,它是基于Transformer架构的深度神经网络模型,拥有超过1000亿个参数,是目前世界上最大的中文预训练语言模型。讯飞星火认知大模型使用了超过1000亿字的中文文本数据进行训练,具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力,能够有效地捕捉中文语言的复杂性和多样性。

5.实在智能——TARS

实在的国产大模型,TARS(塔斯)历经半年研发,近期正式上线开始内测。这是国内人工智能企业、RPA赛道头部实在智能自研垂直领域的大语言模型,在TARS大模型中叠加了多项自然语言处理前沿技术,基于开源基座模型,在千亿级高质量Tokens上进行了充分训练,完整复现了Pretrain、SFT和RLHF三个阶段,语言理解能力及指令跟随能力等在横向对比测试中均取得良好效果。

TARS大模型全面支持私有化部署,用户可完全自主掌控数据和模型,确保内部敏感数据的安全性,并可根据业务需求进行定制化开发。响应国家互联网信息办公室发布的“关于《生成式人工智能服务管理办法(征求意见稿)》”,在TARS大模型中叠加了多项自然语言处理前沿技术。如:模型的不当言论判别,从而进一步增强了模型的生成效果和安全性。目前,实在TARS大模型正在进行更全面、更完整的效果评测,相关结果将在近期陆续公布。

6.复旦大学——MOSS

MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型,拥有160亿参数。它由约7000亿中英文及代码单词预训练得到,精度要求不那么高的话,甚至可以在单张3090显卡上运行。MOSS支持中英双语,拥有多轮对话和使用多种插件双重能力,具备搜索引擎、文字生成图片、计算器、方程求解的“技能点”。

作为“国内首个开放测试的ChatGPT”,MOSS已经经历了两版迭代,一版是公开邀请内测的MOSS 002版本,另一版是内部测试版本OpenChat 001。

7.智源研究院——悟道3.0

智源研究院在2023北京智源大会上发布了悟道3.0大模型系列,包括首个支持中英双语知识、开源商用许可协议、支持国内数据合规要求的开源语言大模型悟道·天鹰(Aquila),以及一站式的科学、公正、开放的基础模型评测体系天秤(FlagEval)。它包括7B、33B的基础模型,以及AquilaChat对话模型和AquilaCode文本代码生成模型。

8.360——360智脑

360智脑是360公司开发的一款生成式人工智能大模型产品,集合了 360CV 大模型、360GPT 大模型、360GLM 大模型和 360 多模态大模型的技术能力,具有语言理解、图像识别、自然语言处理等多面应用能力。

9.澜舟科技——“孟子”

孟子预训练模型是基于团队自研技术研发的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务,能快速满足不同领域、不同应用场景的需求。孟子模型基于 Transformer 架构,包含十亿参数量,基于数百 G 级别涵盖互联网网页、社区、新闻、电子商务、金融等领域的高质量语料训练。

10.中科院自动化所——紫东太初

紫东太初,是中国科学院自动化研究所研发的跨模态通用人工智能平台 。全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力,取得了预训练模型突破性进展。紫东太初大模型将文本 + 视觉 + 语音各个模态高效协同,实现超强性能,在图文跨模态理解与生成性能上都能领先目前业界的SOTA模型,高效完成跨模态检测、视觉问答、语义描述等下游任务。

目前,技术不断发展推陈出新,国内大模型还在不断涌现,无论是已有模型的优化升级还是新模型的横空出世都值得我们拭目以待,也期待大模型能为各行各业的发展助力赋能,提高各行各业数据处理和决策效率、增强风险预测和控制能力,使数字化时代更上一层楼。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13017.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谁在杀死 ChatGPT ?

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) AI浪潮汹涌而来,离我们越来越近,有时候近到只差一个APP的距离。很多人把AI科技可能带来的全方位社会变革,称之为第四次科技革命,把ChatGPT称为“第四次科…

实在智能RPA受邀出席2023年东莞市数字赋能峰会,聚力数智制造

3月17日,“数字东莞 科创强市2023年东莞市数字赋能峰会”在松山湖光大We谷圆满举行。本次大会以创新性、专业性、平台化、战略性等为特色,涵盖当今前沿技术、行业痛点、商业模式。会上中国信通院的专家分享了《东莞市数字经济发展报告(2022年…

系统重构实施,百亿级核心交易如何保证准确性?

重构:又喜欢又害怕 一个企业级的应用,即使是诸葛亮级别的设计人员,最初的考虑都不可能尽善尽美,会存在设计不够或者设计过头的情况。加上业务的发展可能与当初的推想不一致,这样就使得上线初期稳稳当当的一个系统&…

smart-mqtt v0.19最新版本实现消息重发规范,提升通讯可靠性

1、smart-mqtt 简介 smart-mqtt,是smartboot组织下面向物联网的首款解决方案,它使用Java语言开发,提供高效、可靠的MQTT Broker服务。 smart-mqtt的独特优势在于大量设备接入的情况下,仍能保持低延迟和高吞吐量,满足物…

社交泛娱乐出海如何抓住AIGC?我在融云WICC上看到了答案

大模型掀起的AIGC时代,所有企业的所有业务与产品都值得利用大模型技术重做一遍,接下来也将有越来越多依托AIGC技术的创新应用涌现。关注【融云全球互联网通信云】了解更多 在社交泛娱乐赛道,AI大模型技术也呈现出了加速落地的态势。日前&…

选型最佳实践|从业务场景分析直播SDK

摘要 近两年即时通讯/直播产品炙手可热,市场上针对ToB的产品日益增多,企业该如何去选型呢?本文分享了笔者对于直播产品的思考,将从直播SDK实例功能特性、常见业务场景、注意事项及最佳实践等方面介绍如何进行实例选型,…

个性化对话模型及知识库:自有数据在LLM上的应用方案整理

原文:个性化对话模型及知识库:自有数据在LLM上的应用方案整理 - 知乎 最近的这几个月,AIGC场景的模型与应用开始大量涌现。其中LLM(Large Language Models,大语言模型),所展现出来的自然语言理…

最新ChatGPT GPT-4 文本生成技术详解(附ipynb与python源码及视频讲解)——开源DataWhale发布入门ChatGPT技术新手从0到1必备使用指南手册(三)

目录 前言最新ChatGPT GPT-4 文本生成技术详解1 引言2 文本摘要任务2.1 什么是文本摘要?2.2 常见的文本摘要技术2.3 基于OpenAI接口的文本摘要实验2.3.1 简单上手版:调用预训练模型2.3.2 进阶优化版:基于自定义语料fine tune 3 文本纠错任务3…

ChatGPT能解决部分就业问题,平台化服务迅速涌现 | CCF C³@滴滴

杨净 整理自 凹非寺量子位 | 公众号 QbitAI 我对城市大脑的前景高度怀疑。 城市道路交通就像安卓平台,生态参与方很多。 ChatGPT时代平台化服务会迅速涌现,某种程度上解决了一部分就业问题。 …… 在最新CCF C活动现场,30余位学者专家来到滴滴…

ChatGPT 3.5/4 双双升级:更长,更便宜,更开放,更可控

OpenAI 今年早些时候发布了 gpt-3.5-turbo 和 gpt-4,并且在短短几个月内,开发者在这些模型上开发了很多令人印象深刻的应用。 6月13日, OpenAI 官宣了版本更新的内容: Chat Completions API 中新增了函数调用功能。更可控的 gpt-4…

ChatGPT提高你日常工作的五个特点,以及如何使用它来提高代码质量

ChatGPT已经完全改变了代码开发模式。然而,大多数软件开发者和数据专家们仍然不使用ChatGPT来完善——并简化他们的工作。 这就是我们在这里列出提升日常工作效率和质量的5个不同的特点的原因。 让我们一起来看看在日常工作中如何使用他们。 警告:不要…

ChatGPT 数据集之谜

ChatGPT这把火越烧越旺。国内很多大厂相继声称要做中文版ChatGPT,还公布了上线时间表,不少科技圈已功成名就的大佬也按捺不住,携巨资下场,要创建“中国版OpenAI“。 不过,看看过去半个月在群众眼里稍显窘迫的Meta的Gal…

透过ChatGPT的进化足迹,OpenAI传达了哪些信号?

古希腊神话中,一位名叫赫尔墨斯的神,会充当人神之间的信使,穿着带有双翼的飞鞋,行走在神明与人类之间。 根据《荷马史诗》的记载:“在天神中,赫尔墨斯是最喜欢引导凡人前行的。”这句话用来形容OpenAI与AI的…

炸裂——关于Azure OpenAI的几个更新

感觉好久没有写随笔了,虽然从年初至今,一直被持续不断涌现的新 AI 消息震惊,也一直不断组织和参与各种 AI 相关的活动、直播,但确实挺久没有写文字了。今天是下半年的第一天,也是暑假的第一天,忙完家务&…

腾讯员工痛诉:从阿里来的同事秀“内卷”

推荐专门分享AI技术的公众号 关注后,回复:ChatGPT ,领取账号 来源丨蚂蚁大喇叭 https://mp.weixin.qq.com/s/DblmMOXYQ7yHE_NbhaGoCA 反内卷,你该反的是你周围的“卷王”同事! 最近大厂员工手撕领导,反内卷…

为什么是毫末智行成为了DriveGPT的破壁人?

作者 | 魏启扬 来源 | 洞见新研社 毫末智行有着天生的紧迫感。 很多科技公司一年才举办一次的品牌日活动,毫末智行硬是办成了一个季度一次,活动频次的提高,则意味着组织内部新陈代谢的提速,从研发到落地乃至运营,都要…

有了数据湖,数据仓库究竟能不能被取代?

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 数据湖是近两年中比较新的技术在大数据领域中,对于一个真正的数据湖应该是什么样子,现在对数据湖认知还是…

DriveGPT自动驾驶大模型中国玩家首发!1200亿参数,毫末智行出品

贾浩楠 发自 凹非寺量子位 | 公众号 QbitAI 早知道会有这一天,但没想到如此快: GPT技术,“上车”! DriveGPT,首个应用GPT模型和技术逻辑的自动驾驶算法模型,正式官宣,中文名雪湖海若。 可能你已…

写个AI虚拟主播:看懂弹幕,妙语连珠,悲欢形于色,以一种简单的实现

这不是你期望的介绍深度学习大模型的文章。而是使用人人都能理解、编程、运行的简单技术(包括机器学习和非机器学习技术),通过一系列工程进行整合、组装,从而实现一个 AI 虚拟主播的故事。 muvtuber 让 AI 成为虚拟主播&#xff…

chatgpt赋能python:Python遍历-一种高效的数据处理技术

Python 遍历 - 一种高效的数据处理技术 对于程序员来说,数据处理是一个常见的任务。而在处理数据时,遍历是最常用的技术之一。Python 是一种强大的编程语言,它提供了很多用于数据遍历的工具和函数。在本文中,我们将介绍 Python 中…