LLM Agent发展演进历史（观看metagpt视频笔记）

LLM Agent发展演进历史（观看metagpt视频笔记）

news/2024/12/20 14:05:43/文章来源:https://blog.csdn.net/elecjack/article/details/134976024

LLM相关的6篇重要的论文，其中4篇来自谷歌，2篇来自openai。技术路径演进大致是：SSL (Self-Supervised Learning) -> SFT (Supervised FineTune) == IT (Instruction Tuning) -> RLHF。
word embedding的问题：新词如何处理，新词的embedding如何表征；但LLM根据token或字做输出的方式，很大程度上可以解决这个问题。
在这里插入图片描述

在谷歌有很大的机器资源去调用，使得BERT有机会做成大模型；BERT出来后，NLP之前所有的trick都失效了；BERT证明了大模型这条路是可行的。
在这里插入图片描述

Openai是把所有资源都集中到LLM这一件事情上，集中所有资源于一点，这就是战略选择。
在这里插入图片描述

Instruction tuning非常重要，带来了范式的转化。
[图片]

RLHF将模型毒性从40%降低到0.6%。
[图片]

GPT3.5 turbo，据业界推测，是个20-30B的蒸馏版本模型
[图片]

[图片]

GPT有可能会开源，如果是这样，LLM水平面上升，可能会淹没其它很多开源模型。
[图片]

什么是智能体？智能体= LLM + 记忆 + 规划 + 工具 + 神经 + 直觉
[图片]

Agent需要有硬件支持，是一个全新的物种。暴露度：编程是63.4%，所以编程在很大程度上也是可被替代的。
[图片]

langchain的设计比较糟糕，复杂度太高了；违背了单接口原则。
[图片]

更关注MMLU榜单：https://paperswithcode.com/sota/multi-task-language-understanding-on-mmlu
[图片]

数据结构和API设计图，有较高价值；LLM具有很强的信息收集、处理能力。一个200w人民币架构师的工作，有可能花几美元就解决。
[图片]

人类在这里主要扮演投资者。
[图片]

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/216799.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

文档或书籍扫描为 PDF：ScanPapyrus Crack

文档或书籍扫描为 PDF：ScanPapyrus Crack

ScanPapyrus 可让您快速轻松地将文档或书籍扫描为 PDF，批处理模式使扫描过程快速高效，自动处理书籍并将其拆分为单独的页面用于快速扫描文档、书籍或打印照片的扫描仪软件快速扫描文档使用此扫描仪软件，您无需在扫描仪和计算机之间来回移动…

阅读更多...

JavaEE 09 锁策略

JavaEE 09 锁策略

1.锁策略 1.1 乐观锁与悲观锁其实前三个锁是同一种锁,只是站在不同的角度上去进行描述,此处的乐观与悲观其实是指在预测的角度上看会发生锁竞争的概率大小,概率大的则是悲观锁,概率小的则是乐观锁乐观锁在加锁的时候就会做较少的事情,加锁的速度较快,但是消耗的cpu资源等也会…

阅读更多...

大数据机器学习与深度学习——过拟合、欠拟合及机器学习算法分类

大数据机器学习与深度学习——过拟合、欠拟合及机器学习算法分类

大数据机器学习与深度学习——过拟合、欠拟合及机器学习算法分类过拟合，欠拟合针对模型的拟合，这里引入两个概念：过拟合，欠拟合。过拟合：在机器学习任务中，我们通常将数据集分为两部分：训…

阅读更多...

beebox靶场A3 low级别 xss通关教程（二）

beebox靶场A3 low级别 xss通关教程（二）

六：xss get型 eval 通过观察我们可以发现url地址中存在一个date函数那我们可以试一下把后面的date()函数去掉，直接写入一个alert(555) 发现直接弹出一个框，证明有xss漏洞七：xss href 直接进入页面会看到是get方法&#xff0c…

阅读更多...

【JVM从入门到实战】（五）类加载器

【JVM从入门到实战】（五）类加载器

一、什么是类加载器类加载器（ClassLoader）是Java虚拟机提供给应用程序去实现获取类和接口字节码数据的技术。类加载器只参与加载过程中的字节码获取并加载到内存这一部分。二、jdk8及之前的版本类加载器分为三类： 启动类加载器-加载Ja…

阅读更多...

Docker Compose入门：打造多容器应用的完美舞台

Docker Compose入门：打造多容器应用的完美舞台

Docker Compose 是一个强大的工具，它允许开发者通过简单的 YAML 文件定义和管理多容器的应用。本文将深入讨论 Docker Compose 的基本概念、常用命令以及高级应用场景，并通过更为丰富和实际的示例代码，助您轻松掌握如何通过 Docker Compose 打…

阅读更多...

VLAN协议与单臂路由

VLAN协议与单臂路由

文章目录 VLAN协议与单臂路由一、VLAN的概念及优势1、分割广播域2、VLAN的优势3、VLAN数据帧二、VLAN的种类1、静态VLAN2、动态VLAN3、VLAN划分方式三、静态VLAN的配置1、VLAN的范围2、静态VLAN的配置2.1 配置静态VLAN的步骤2.2 vlan三种端口类型举例：配置静态VLA…

阅读更多...

1688按关键字搜索工厂数据，商品详情页数据的采集

1688按关键字搜索工厂数据，商品详情页数据的采集

公共参数名称类型必须描述keyString是调用key（必须以GET方式拼接在URL中,点击获取测试key和secret）secretString是调用密钥api_nameString是API接口名称（包括在请求地址中）[item_search,item_get,item_search_shop等]cacheStrin…

阅读更多...

【稳定检索】2024年物理化学工程与应用力学国际会议(ICPCEAM 2024)

【稳定检索】2024年物理化学工程与应用力学国际会议(ICPCEAM 2024)

2024年物理化学工程与应用力学国际会议(ICPCEAM 2024) 2024 International Conference on Physical and Chemical Engineering and Applied Mechanics(ICPCEAM) 一、【会议简介】 2024年物理化学工程与应用力学国际会议(ICPCEAM 2024)将于2024年3月9日在中国上海盛大召开。本次…

阅读更多...

SpringIOC之@EnableLoadTimeWeaving

SpringIOC之@EnableLoadTimeWeaving

博主介绍：✌全网粉丝5W+，全栈开发工程师，从事多年软件开发，在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战，博主也曾写过优秀论文，查重率极低，在这方面有丰富的经验✌ 博主作品：《Java项目案例》主要基于SpringBoot+MyBatis/MyBatis-plus+…

阅读更多...

论文阅读：PointCLIP: Point Cloud Understanding by CLIP

论文阅读：PointCLIP: Point Cloud Understanding by CLIP

CVPR2022 链接：https://arxiv.org/pdf/2112.02413.pdf 0、Abstract 最近，通过对比视觉语言预训练(CLIP)的零镜头学习和少镜头学习在2D视觉识别方面表现出了鼓舞人心的表现，即学习在开放词汇设置下将图像与相应的文本匹配。然而，…

阅读更多...

jdk+zookeeper+kafka 搭建kafka集群

jdk+zookeeper+kafka 搭建kafka集群

环境准备环境资源包： jdk-8u341-linux-x64.tar.gz kafka_2.12-2.2.0.tgz zookeeper-3.4.14.tar.gz server-idip状态server110.206.120.10leaderserver210.206.120.2followerserver310.206.120.3follower 一、安装jdk 因为kafka需要Java环境，所以优先…

阅读更多...

Linux AMH服务器管理面板本地安装与远程访问

Linux AMH服务器管理面板本地安装与远程访问

最近，我发现了一个超级强大的人工智能学习网站。它以通俗易懂的方式呈现复杂的概念，而且内容风趣幽默。我觉得它对大家可能会有所帮助，所以我在此分享。点击这里跳转到网站。文章目录 1. Linux 安装AMH 面板2. 本地访问AMH 面板3. Linux安装…

阅读更多...

股票放量成交后，大涨的概率有多少？

股票放量成交后，大涨的概率有多少？

很多时候，经常有人会感觉，成交量突然放大5倍以上，后面的股价大概率会上涨，很多投顾班的老师也是给大家展示这样的感觉，那究竟有多大比例的上涨呢？ 【文章仅是数据分析，不构成任何投资建议】一…

阅读更多...

【Docker】进阶之路：（九）Docker网络

【Docker】进阶之路：（九）Docker网络

【Docker】进阶之路：（九）Docker网络 Docker网络模式简介bridge网络模式host网络模式none网络模式container网络模式user-defined网络模式1.创建自定义的bridge网络2.使用自定义网络高级网络配置docker network命令为什么要了解容器的网络模…

阅读更多...

zabbix——实现高效网络监控

zabbix——实现高效网络监控

在当今的数字化时代，网络和服务器的健康状况对于企业的正常运营至关重要。为了及时发现和解决潜在的问题，许多企业选择使用网络监控工具来追踪服务器的性能和网络参数。其中，Zabbix是一个功能强大且开源的网络监控工具，被广泛应用…

阅读更多...

CSS的基本选择器及高级选择器（附详细示例以及效果图）

CSS的基本选择器及高级选择器（附详细示例以及效果图）

Hi i,m JinXiang ⭐ 前言 ⭐ 本篇文章主要介绍HTML中CSS的基础选择及高级选择器（详解）以及部分理论知识 🍉欢迎点赞 👍 收藏 ⭐留言评论 📝私信必回哟😁 🍉博主收将持续更新学习记录获&#xf…

阅读更多...

微服务--07--Sentienl中使用的限流算法

微服务--07--Sentienl中使用的限流算法

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 Sentienl中使用的限流算法1、计数器固定窗口算法2、计数器滑动窗口算法----（默认）3、漏桶算法----（排队等待）4、令牌…

阅读更多...

Apache Web 服务器监控工具

Apache Web 服务器监控工具

将Apache Web 服务器监控纳入 IT 基础架构管理策略有助于先发制人地识别性能瓶颈，这种主动监控方法提供必要的数据，以确保 Web 服务器能够胜任任务，并在需要时进行优化。保证客户获得流畅、无忧的用户体验可以大大有助于巩固他们对组织的信任…

阅读更多...

《拥抱变化：解析极限编程》读书笔记

《拥抱变化：解析极限编程》读书笔记

文章目录一、书名和作者二、书籍概览2.1 主要论点和结构2.2 目标读者和应用场景三、核心观点与主题3.1开发问题3.2 极限编程实践3.3 极限编程计划与设计3.4 极限编程的实现四、亮点与启发4.1 最有影响的观点4.2 对个人专业发展的启示五、批评与局限性5.1 可能存在的争议和过…

阅读更多...

最新文章

推荐文章