我的大模型观:我眼中的LLM

文章目录

  • 大模型是有智能的。
  • 也许,大模型是一场骗局?
  • 从头训练or微调
  • 我想象中的大模型架构
  • 大厂的大模型
  • 中小厂和个人开发该何去何从?

今年,大模型火的一塌糊涂。最近几个月paper with code上,前几名的论文几乎都是生成模型和LLM。参加AI相关的会议,也是千篇一律的LLM。国内的大厂争先恐后的发布自己的大模型,比如百度的文心、360的智脑、讯飞的星火等等,呈现出百花齐放百家争鸣的繁荣现象。。北京市推出了首批的大模型应用案例,从政府层面得到了对大模型的肯定。
在这里插入图片描述

结合最近论文和实践,我对大模型有了一些自己的看法:

大模型是有智能的。

虽然不愿意承认这点,但是大模型的表现确确实实的展现出了智能。比如chat paper这样的应用,利用大模型读paper,提取paper的关键内容;医疗大模型 ——HuatuoGPT(华佗GPT)使语言模型具备像医生一样的诊断能力和提供有用信息的能力;ChatLaw作为法律大模型在2000道司法考试上得到了1733的分数等等。这些现象足以证明大模型能够理解人类的表达意图,是有智能的。甚至,有人已经发出了硅基生命将会统治碳基生命的言论,早早做起了投降派。

其实,3年前的CLIP给人留下了深刻的印象,通过对4亿的文本——图像对进行训练出来的多模态模型,零样本迁移在ImgetNet数据集上超越了ResNet50,同时在物体检测也有着不俗的表现。CLIP打破了计算机视觉的原有范式,真正做了对文本和图像的理解 论文翻译详见:https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/125452516。

CLIP的成功证明提高模型的参数规模和数据规模,可以产生意想不到的智能。

也许,大模型是一场骗局?

数据集一般分为训练集、验证集和测试集,这三个数据集是不重复的。训练ChatGPT的数据集有几个PB,几乎是人类已知数据的总和,很难保证数据集不重复。而且我们对ChatGPT的提问也几乎包含在这些数据集里。ChatGPT更像一个经过压缩的数据库,我们的提问就变成了查询和检索,只不过这样的检索效率很高,大大超越了现有的搜索引擎。

如果是这样,大语言模型的智能是非常有限的,也需没有智能。我们用小模型能不能做到呢?比如1B或者更小的模型。

今年高考题放出来后,FlagEval 大模型评测团队从 2023年高考考卷中整理了 147 道客观题(其中语文 20道,英语 44道,历史 31道,数学 9道,物理 8道,政治 21道,生物 14道)形成 Gaokao2023 V1.0 评测集。经过测试,GPT-4 和 GPT-3.5-turbo 正确率分别为 60.4%、42.5%。750×60%=450分。陆奇博士说ChatGPT的能力达到了斯坦福大学本科生的水平。貌似高考450分很难上斯坦福吧!面对新问题,ChatGPT的表现并不理想。

当然,ChatGPT在很多其他领域的表现也不尽人意,出现了幻想!

大语言模型的能力来源于数据还是模型?这需要去验证,也许不需要1750亿这样的大模型就能达到现有ChatGPT能力。这个问题只能有OpenAI去回答。

从头训练or微调

对于有卡的人或者公司来说,这不是个问题。但是对于很多小点的公司和个人不得不考虑二者的成本和收益比。微调,特别是量化微调可以大大减少训练成本,我们在基座模型上使用消费级的显卡就可以完成。QLORA足以在单个48GB GPU上微调65B参数模型,同时保留完整的16位微调任务性能。邱锡鹏团队实现了在8×RTX 3090的机器上对65B模型进行全参数微调。这些方法大大降低了大模型的训练门槛。

组织专业的数据在已有的模型上微调,,可以提升大模型在专有领域的能力,但是带来的后果是模型其他能力的退化,比如多轮对话能力在微调之后有可能丧失了,出现了灾难性的遗忘!

上周和众多的专家交流后,我得到了答案。在组织数据的时候,可以将专有领域的数据和训练基座模型的原有数据融合去训练,有能力做全参数训练的,可以做全参数微调,如果没有的可做一些量化微调。不过训练成本会变的很大,还是不适合个人玩家。

我想象中的大模型架构

一个通用的大语言模型很难满足人们的需求,随着专有领域蓬勃发展,专有领域小模型在各自的领域吊打ChatGPT.。所以,我对大模型的架构思考了良久!我认为大模型的整体架构应该是个模型集。如下图:
在这里插入图片描述

通用的大模型承担中心处理的角色,它有很强的语言交互能力和多轮对话的能力。在实际生活中,人们很难一句话描述出自己的需求,往往需要多轮的沟通,等待双方的认知对齐后才能得出正确的需求。在得出正确的需求后,大模型会给出答案。我们可以根据置信度或者用户的反馈来判断回答的合理性。如果不满足则,有大模型发起对专业模型调用推理的请求,让专业的模型对问题做出回答。

如果用木桶理论来说明。大模型的能力遵循木桶理论,是各方面的能力都具备,但不一定精通的通用模型。而专业模型则是新木桶原理,尽量去发挥自己的长处,在自己的专属领域达到极致。
在这里插入图片描述

大厂的大模型

各大厂陆续发布了自己的大模型,呈现出百花齐放百家争鸣的繁荣景象。但是我们也不能不忽略一个问题,目前,还没有一款模型能够达到ChatGPT和GPT-4的水平。尽管,有些模型在评测上宣称达到了ChatGPT90%以上的能力,但是在实际使用中给人的体验非常差。

还有一个问题,大模型评测没有具体的标准,很多厂家都是选用人为的评估,或者使用ChatGPT评估,潜意识中认为ChatGPT就是最好的。由于缺乏统一的评测标准,大模型的真是价值无法得到准确的验证。这个是亟待解决的。

其实,通用的大模型只能由大厂来完成,中小厂根本不具备训练大模型的能力,更别说去部署成服务供大家使用。然而,我们需要这么多大模型吗?

我觉得不需要的,悲观的说,世界上只需要一个通用大模型就够了或者说国内有一个通用的大模型就够了。就像曾经的诸子百家,流传下来的寥寥无几,大模型也是这样的道理。作为大厂,有实力又有责任去完成这个通用大模型。

在此,希望大厂之间能够联合起来,把数据、算力、算法集中起来,去打造一个我们中国自己的AI大模型。
在这里插入图片描述

中小厂和个人开发该何去何从?

对于中小厂和个人,很难完成大模型的全流程,最好把有限的资源和精力放在专业领域模型或者说垂直领域大模型。制作专业的数据集,在现在开源的基座模型微调就可以得到非常专业的垂直大模型,很多初创公司和个人开发者就能完成。

目前,开源的一些垂直领域大模型,在自己的领域可以吊打ChatGPT也证明这个方向是可行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19047.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高考志愿填报提示词指南;用孩子教科书训练家教GPT;AI提示工程师6项必备技能;创业者最核心的特质 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 Google 警告员工:不要使用自家 Bard 生成的代码 上周,谷歌警告员工不要使用自家AI聊天机器人 Bard 生成的代码…

在我的指导下,ChatGPT写了一个木马!

最近玩这个ChatGPT是越来越上头了。 我一直在思考着,这玩意儿除了拿来玩,能不能真正帮助我们工作? 昨天晚上,在我的“指导”下,我让这家伙帮我写了一个“木马”。 当然,之所以要打上引号,是因…

stanfordcorenlp识别中文人名实战记录及心得

前言: 一直在找一个能够精确识别中文人名的自然语言处理工具包,期间也找到了stanfordcorenlp, 并且经过在网上的大量摸坑探索之后,还是成功使用上了stanfordcorenlp,但是经过后期比较后,发现精确度还是没有达到满意的效果,后期发现了精度更高一些的jieba和paddlehub, 但还是把这…

apple登录服务端验证

Sign In With Apple 从登陆到服务器验证 服务端向苹果请求验证 手机端需要提交 user 、authorizationCode 、 identityToken 字段信息(code和token字段苹果返回的是 base64 Data 形式,手机端可以先转换 base64 字符串之后在给服务器)到服务器…

iOS 苹果登录(第三方登录)

Sign In with Apple是iOS 13的新增功能 所以现在苹果的app有第三方登录的功能需要加上苹果的登录(不然审核时会被拒掉) 一、证书文件配置 登录开发者账号,创建Bundle ID时 勾选 Sign In With Apple ,开启登录功能(勾…

Apple ID很久没有登录,使用邮件验证修改手机号的方法

背景:没有已登录的苹果设备 手机号已经更换 知道登录密码(不知道登录密码,在官网修改,也是通过邮件验证) 解决方法 1、登录账号和密码,会提示需要输入验证码。点击“未收到验证码” 2.点击第二项&#x…

Sign In with Apple - 使用苹果账号登录你的应用

编辑:老峰,作者:KANGZUBIN 来源:小专栏《WWDC19 内参》 苹果在 9 月 12 号更新了审核指南,加入 4.8 Sign in with Apple 一条,要求所有使用 第三方登录 的 App,都 必须接入 Sign in with Apple。…

IOS企业应用出现无法验证,需要网络连接以在这台iPad上验证。接入互联网并重试

这两天出现一个很奇怪的现象,IOS 13.5.1版本以上的系统安装应用时企业APP无法信任,但是IOS 13.5.1版本以下又可以信任。然后我做了以下操作之后就可以正常安装和信任了。 1.更换新的Development证书,原先的Development证书类型是Development&…

关于ipad:无法验证服务器身份

ipad 连接网络后,有时候会冒出这个弹窗,并且关掉后仍继续弹出 可以尝试以下几种方法:(我是用③解决的) ①. 确保你的iPad连接的是稳定的网络。有时候网络连接不稳定会导致无法验证服务器身份。 我们学校这个校园网…

Mirai登陆QQ的登陆验证过程

1.配置好一切,启动mirai进行登陆 设置好Bot的账号密码,启动项目 2.弹出如下弹窗,提示我们需要进行滑块验证 1.复制红框内的URL到浏览器打开 2.记得在加载完后按f12打开控制台 3.控制台切换到network/网络 3. 拖动滑动窗口,正确进行验证,观察控制台的响应 1.找到cap_union_new_…

iOS接入Google登录

目录 1.在Google Cloud后台配置客户端ID 2.iOS配置URL Types​编辑 3.代码实操 1.在Google Cloud后台配置客户端ID 首先要在 Google Cloud 中创建一个项目。新创建的Project需要先配置同意屏幕。一共有4步骤需要配置。 1.OAuth 同意屏幕 User Type选择"外部"进行创…

「超全!」谷歌大神 LeetCode 刷题笔记 PDF 分享

这是一本面向有C++编程基础,但缺乏刷题经验的读者的教科书和工具书(不适合完全的编程小白喔);同时,这是一本总结了15种常见类型题,50种细分类型题,101道题解的LeetCode刷题指南~ 作者高畅是谷歌无人车部门(Waymo)的工程师,从事计算机视觉和机器学习方向。 他在美国…

《LeetCode》—— 哈希

今天刷题讲解的主要讲的是关于——哈希这个知识点的题目讲解。 目录 (一)缺失的第一个正整数 (二)数组中只出现一次的两个数字 1、直接法 2、哈希 (三)直线上最多的点数 (一)缺…

文心一言 VS 讯飞星火 VS chatgpt (53)-- 算法导论6.2 5题

五、MAX-HEAPIFY的代码效率较高,但第 10 行中的递归调用可能例外,它可能使某些编译器产生低效的代码。请用循环控制结构取代递归,重写 MAX-HEAPIFY代码。 文心一言: 以下是使用循环控制结构取代递归调用的 MAX-HEAPIFY 代码&…

【Day18】LeetCode算法刷题[1694. 重新格式化电话号码 ] [202.快乐数]

刷题打卡,第十八天 题目一、1694. 重新格式化电话号码题目二、202.快乐数 题目一、1694. 重新格式化电话号码 原题链接:1694. 重新格式化电话号码 题目描述: 给你一个字符串形式的电话号码 number 。number 由数字、空格 、和破折号 - 组…

List解答LeetCode杨辉三角

作者:月亮嚼成星~ 博客主页:月亮嚼成星~的博客主页 专栏:数据结构与算法 工欲善其事必先利其器,给大家介绍一款超牛的斩获大厂offer利器——牛客网 点击免费注册和我一起刷题吧 目录 了解杨辉三角 题目要求: 解答思…

张朝阳开课手推E=mc²,李永乐现场狂做笔记!CEO当太久都忘了他是MIT物理博士...

晓查 萧箫 明敏 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI 张朝阳当物理老师还真是当上瘾了。 刚刚直接完成了一场线下课,当场手推质能方程,一整面黑板墙都差点没盛下。 这个姿势,是不是有你大物老师内范儿了(手动狗头)…

文心一言 VS 讯飞星火 VS chatgpt (25)-- 算法导论4.2 7题

七、设计算法,仅使用三次实数乘法即可完成复数 abi和cdi 相乘。算法需接收a、b、c和d 为输入,分别生成实部 ac-bd 和虚部adbc。 文心一言: 可以使用如下算法来计算复数 abi 和 cdi 的积,且只需进行三次实数乘法: 1.…

文心一言 VS 讯飞星火 VS chatgpt (24)-- 算法导论4.2 6题

六、用Strassen 算法作为子进程来进行一个 knn 矩阵和一个nkn 矩阵相乘,最快需要花费多长时间?对两个输入矩阵规模互换的情况,回答相同的问题。 文心一言: Strassen 算法是一种用于矩阵乘法的分治算法,它将原始的矩阵分解为较小…

文心一言 VS 讯飞星火 VS chatgpt (41)-- 算法导论5.4 5题

五、在大小为n的集合中,一个k字符串构成一个k排列的概率是多少?这个问题和生日悖论有什么关系? 文心一言: 在大小为n的集合中,一个k字符串构成一个k排列的概率是1/k!,这是由于排列的总数是k!,而每个字符串被选中的…