作者 | gongyouliu
自从去年11月30日openAI发布chatGPT以来,chatGPT引爆了新一轮科技革命。最近很多年都没有哪一项科技进步如chatGPT这般吸引全球的目光。除了媒体的大肆报道,国内外各个科技公司、科研机构、高等院校都在跟进,不到半年时间,就跑出了非常多的大模型应用的创业公司,做得优秀的如midjourney、jasper、runway等,都获得了上亿美元的融资,估值达数十亿美金规模。
国内也不甘落后,各个大厂、创业公司、科研院校都相继发布了大模型产品(如百度的文心一言、复旦的MOSS等),也有不少大佬亲自下场做大模型(如李开复、王慧文、王小川等)。
为了方便大家了解国内大模型的进展和生态,本文整理了到目前为止所有的国产大模型产品和公司,方便感兴趣的读者学习、参考、传播。如果你觉得本文有价值,请分享给需要的人,大家一起推动新一轮人工智能浪潮的暴发。
行业首份AI全栈手册,现在开放下载啦!!
长达3000页,涵盖大语言模型技术发展、AIGC技术最新动向和应用、深度学习技术等AI方向。
微信公众号关注“夕小瑶科技说”,回复“789”下载资料。希望对你有所帮助哦!
注:下面表格链接可以点击查阅。
企业类型 | 入局大模型的企业 | 大模型相关产品 | 大模型特性简介 | |
互联网公司 | 百度 | 文心大模型/文心一言 | 通用的多模态(可以处理文本、语音、图片、视频等)大模型 | |
阿里 | 通义大模型/通义千问 | 语言大模型,可以写作、写诗、写代码等 | ||
腾讯 | 混元大模型/混元助手 | 语言大模型,训练成本低、速度快 | ||
华为 | 盘古大模型 | 有基础大模型,也有NLP、视觉、气象等垂直大模型 | ||
字节跳动 | 飞书“My AI” | 聚焦智能助手,写文档、汇总、会议等能力 | ||
京东 | Chat JD | 聚焦于文本、语音、对话和数字人生成等4个方面 | ||
知乎 | 知海图AI | 大语言模型,初步用于热榜摘要 | ||
昆仑万维 | 天工 | 国内首个对标 ChatGPT 的双千亿级大语言模型 | ||
麒麟合盛(APUS) | 天燕大模型AiLMe | 多模态人工智能大模型,参数规模为1000亿,具备对文本、图像、视频、音频的理解和生成能力 | ||
360 | 360智脑 | 是360搜索与大语言模型技术的结合,本质是新一代“智能搜索” | ||
网易 | 中文预训练大模型“玉言” | 参数达 110 亿,可应用于语言助手文本创作、新闻传媒、智能客服等领域 | ||
小米 | 暂无信息 | 无 | 无 | |
AI公司 | 商汤科技 | 日日新SenseNova/商量 | 文生图、代码生成、做视频、2D/3D数字人 | |
科大讯飞 | 讯飞星火 | 包括语言理解、知识问答、逻辑推理,数学能力、代码能力以及多模态能力 | ||
出门问问 | 序列猴子 | 包含以下四款产品:AI写作平台「奇妙文」、AI绘画平台「言之画」、AI配音平台「魔音工坊」、数字人视频与直播平台「奇妙元」 | ||
智谱AI | ChatGLM | ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化,62亿参数。 | ||
澜舟科技 | 孟子MChat可控大模型 | 既有对话能力,又具备翻译、生成、信息搜索等能力,将陆续推出10B和100B参数级的大模型 | ||
毫末智行 | 自动驾驶生成式大模型DriveGPT | 使用的是驾驶场景数据进行模型训练,并通过不断引入真实人驾接管数据,让模型自我优化,逐步训练自己不断给出更高质量的答案 | ||
竹间智能 | 魔力写作 | 将小模型、知识模型与大模型结合,打造了独特的“NLP双引擎“,并将各个领域的中文语料“喂”给模型,“调教”出能生成各类文本的AIGC产品 | ||
MiniMax | 自研大模型 | 已经接入金山WPS AI | ||
第四范式 | 式说 | 「式说」将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现「AIGS」 | ||
面壁科技 | 与知乎合作中文大模型“知海图AI” | 同上面的知乎 | ||
大佬初创公司 | 王慧文 | 光年之外(公司名称) | 目前没有进展出来,之前收购了oneflow这家做深度学习基础架构的软件公司 | |
李开复 | Project AI 2.0 | 目前没有具体产品出来 | ||
王小川 | 百川智能(公司名称) | 目前没有具体产品出来 | ||
前京东掌门人周伯文 | 衔远科技(公司名称) | 目前没有具体产品出来 | ||
科研院所 | 复旦大学邱锡鹏教授团队 | 对话式大语言模型MOSS | 类似chatGPT,学术产品,参数不大,已经开源 | |
武汉人工智能研究院、中国科学院自动化研究所和华为联合研发 | 多模态大模型“紫东太初” | 全模态大模型,可实现文本、图片、语音、视频、3D点云、传感信号等不同模态的统一表征和学习 | ||
上海人工智能实验室 | 天气预报大模型“风乌” | 聚焦天气预报领域 | ||
清华大学 | GLM-130B | 是一个开源开放的双语(中文和英文)双向稠密模型,拥有 1300 亿参数,模型架构采用通用语言模型(GLM) | ||
北京智源人工智能研究院 | 悟道2.0 | 悟道 1.0 已启动了 4 个大模型的开发:悟道 · 文汇、悟道 · 文澜、悟道 · 文源、悟道 · 文溯 | ||
达观数据 | 曹植 | 聚聚金融行业,模型100亿参数 | ||
教育行业 | 网易有道 | 子曰 | 为教育场景自研的类ChatGPT模型 | |
学而思 | MathGPT | 以数学领域的解题和讲题算法为核心 |