【无标题】基于情境依赖因果影响的多智能体协作强化学习

、文章探讨了大型语言模型(LLMs),例如GPT-4,是否以及在何种意义上拥有知识。作者认为,这些模型展现了一种称为“工具性知识”的能力,这种知识允许它们根据输入上下文推断任务结构,并在此基础上进行下个词预测。然而,为了将这种工具性知识视为普通意义上的“知识”,它必须包含一定程度关于现实世界的理解——即“常识知识”。

尽管LLMs主要是通过大规模互联网文本数据训练来预测下一个单词或标记,但文章探讨了这些模型如何能够通过压缩技术捕捉到一定程度的世俗内容,并且可能通过预训练阶段获取到了超越形式语言能力的知识碎片。文章还提到,某些经过微调的LLMs在处理需要常识知识的任务时表现出色,并且预训练模型可以通过所谓的“情境学习”来执行新任务,这表明它们可能已经吸收了一些超出纯粹语言模式匹配的知识元素。

1 系统为什么要具备知识

因为如果系统展现了惊人的对话能力,能够生成连贯、新颖且往往非常复杂的回答。这种能力引发了对于这些模型是否真正拥有知识的兴趣,而不仅仅是能够模仿人类的语言使用。这涉及到对知识本质的哲学探讨,以及我们如何理解智能的起源。具体来说,如果一个系统展示了工具性知识——即它能够成功地完成各种任务并提供大约保持真实的答案——那么这种知识与我们通常意义上的人类知识有何关联?LLMs是否以及如何能包含类似于人类认知科学中的结构化世界模型,这些都是研究者们关心的问题。此外,考虑到LLMs作为黑盒系统的不透明性及其产生错误信息的倾向,这也引发了对AI系统安全性和与人类价值对齐的需求的关注。因此,探索LLMs是否具备知识不仅是为了学术兴趣,也是为了确保未来AI系统的发展能够符合社会期望的标准。

2 工具性知识

这是一种以特定能力集来定义的知识形式。这种知识不仅仅局限于形式上的语言能力,而是包括了更大范围的功能,比如从语言环境中推断出更深层次的任务结构,并根据这些结构来进行后续词汇的预测。这一概念是为了解释像GPT-4这样的大型语言模型(LLMs)如何能够在多种任务中展现出令人印象深刻的性能,而不仅仅是停留在对语言规则和模式的理解上。工具性知识与我们通常所说的人类“常识知识”不同,但它提供了一个框架,用来探讨这些模型是如何处理任务并表现出看似理解世界的行为。

3 LLM如何获取知识

大型语言模型(LLMs)虽然主要训练于预测下一个单词或标记的文本任务,但它们仍能获得一定的世界知识。这是因为LLMs在预测过程中学会了推断任务结构,并利用上下文进行理解和生成;此外,通过所谓的“情境学习”,即使不更新参数,LLMs也可以通过例子学习新任务,从而展现出超越形式语言能力的表现。这些都表明LLMs能够在一定程度上吸收和利用有关现实世界的信息。

更进一步,如果能通过LLM来构建世界模型,则能加速构建安全、真实与价值对齐的AI系统。

  • 1**.解释性**:世界模型提供了结构化的、可解释的表示形式,这使得工程师或用户能够直接对系统施加控制,植入他们的“价值观”和安全措施。

  • 2.安全性与一致性:通过世界模型,可以更容易地使AI系统的行为与人类的价值观保持一致,减少意外的值变化风险,确保AI行为的可预测性。

  • **3.高级接口:**世界模型作为可编程的中级或高级接口,允许直接对AI行为进行编程,这对于确保AI系统的诚实性和与人类价值的一致性至关重要。

  • **4.资源理性:**世界模型允许在系统复杂性和实际需求之间做出合理的资源分配,确保系统在执行任务时不会过度消耗资源,同时保持必要的准确性和功能性。

4 结语

文章探讨了大型语言模型(LLMs)是否拥有知识的问题,提出了LLMs具有由特定能力集定义的“工具性知识”,并讨论了这种知识与人类基于世界模型的“世俗知识”之间的关系及差异。

论文题目: From task structures to world models: What do LLMs know?

论文链接: https://arxiv.org/abs/2310.04276

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/446885.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

废水处理(一)——MDPI特刊推荐

特刊征稿 01 期刊名称: Removing Challenging Pollutants from Wastewater: Effective Approaches 截止时间: 摘要提交截止日期:2024年11月30日 投稿截止日期:2025年5月31日 目标及范围: 该主题是分享去除有毒物…

js操作元素的其他操作(4个案例+效果图+代码)

目录 1. 获取元素的位置和大小 案例:获取元素的位置和大小 1.代码 2.效果 2. 获取元素的可视区域 案例:获取元素的可视区域 1.代码 2.效果 3. 元素的滚动操作 案例:元素的滚动操作 1.代码 2.效果 4. 获取鼠标指针位置 案例:时刻获取鼠标位置 1.代码 2.效果 案例:拖动的小球 1.代…

万物智联创未来,第三届OpenHarmony技术大会在上海成功举办 深圳触觉智能参会

​10月12日,以“技术引领筑生态,万物智联创未来”为主题的第三届OpenHarmony技术大会(以下简称“大会”)在上海成功举办。本次大会由OpenHarmony项目群技术指导委员会(TSC)主办,华为、上海交通大…

阿里云物联网自有app创建之初始化SDK

文章目录 一、新建工程,配置gradle,导入.so文件,生成apk二、上传apk,集成安全图片,下载SDK三、SDK的集成四、初始化SDK 最近在研究阿里云自有app,这是自己的心得。 一、新建工程,配置gradle,导入.so文件,生…

Gin框架官方文档详解03:HTML渲染

注:本教程使用工作区方法管理项目,详见第一讲:创建一个简单的Gin应用。 目录 一、简单渲染二、使用不同目录下名称相同的模板三、自定义模板渲染器四、自定义分隔符五、自定义模板函数六、总结 一、简单渲染 首先,以03HTML渲染为…

机器学习与神经网络:诺贝尔物理学奖的新篇章

机器学习与神经网络:诺贝尔物理学奖的新篇章 引言 2024年诺贝尔物理学奖的颁发,无疑是一个历史性的转折点。这一奖项首次授予了在机器学习与神经网络领域做出杰出贡献的科学家,标志着人工智能技术在科学研究中的重要地位得到了前所未有的认…

3.计算机网络_端口号

端口号的由来 运输层的作用: 在计算机网络中,运输层处在用户功能的最底层、通信部分的最高层的位置,也就是说运输层是用户数据和实际网络通信的桥梁。因此运输层屏蔽了网络的实现部分,以协议的方式向用户层提供了接口&#xff…

Matlab绘图总结(进阶)

本文在前文的基础上进一步整理画图方法 MATLAB画动图_CSDN博客 1. 基础图形绘制 1.1 rectangle(矩形,圆形) 在前文中,讲解了如何使用rectangle,rectangle本意是用来画矩形的,其中,Curvature可…

【一起学Rust | 框架篇 | Tauri2.0框架】高级概念之安全特性的权限与能力

文章目录 前言一、开发前准备1. 准备项目2. 需求分析1. 监听系统热键2. 切换窗口无边框3. 切换窗口全屏 二、安装插件三、前端实现功能四、配置权限 前言 当前时间为 2024 年 9 月,距离Tauri 2.0 的 RC 版本发布迄今已近一个月。从 Tauri 官方渠道可以看出&#xf…

CVESearch部署、使用与原理分析

文章目录 前言1、概述2、安装与使用2.1、源码安装2.1.1、部署系统依赖组件2.1.1.1、下载安装基础组件2.1.1.2、下载安装MongoDB Community Edition 7.0 2.1.2、使用源码安装系统2.1.2.1、安装CVESearch2.1.2.2、填充MongoDB数据库2.1.2.3、填充Redis数据库 2.2、使用方法 3、测…

使用java画一条线。

package p1008;import javax.swing.*; import java.awt.*;public class LineAndTextExample extends JPanel {Overrideprotected void paintComponent(Graphics g) {super.paintComponent(g);// 设置线条粗细Graphics2D g2d (Graphics2D) g;g2d.setStroke(new BasicStroke(5))…

SpringBoot教程(二十四) | SpringBoot实现分布式定时任务之Quartz(基础)

SpringBoot教程(二十四) | SpringBoot实现分布式定时任务之Quartz(基础) 简介适用场景Quartz核心概念Quartz 存储方式Quartz 版本类型引入相关依赖开始集成方式一:内存方式(MEMORY)存储实现定时任务1. 定义任务类2. 定…

Broken pipe异常分析及处理

问题出现:生产上运行的系统业务正常,当在查询数据时,出现后台异常,检查后台日志出现Broken Pipe异常; 如图示: Broken Pipe定义:通常发生在服务器端尝试向已关闭的套接字(客户端/端…

前端面试经验总结1(简历篇)

本文分为3部分,分别为第一部分简历篇,第二部分经典问题篇以及第三部分知识体系篇,都是个人面试经验及同行面试经验总结和整理。 我对于简历的理解是这样的,简历的作用是让看简历的人能够快速、准确地捕捉到有用信息: 你…

大数据存储,搜索智能化的实践分享 | OceanBase 城市交流会精彩回顾

9月21日,“OceanBase 城市交流会”来到了深圳,携手货拉拉大数据技术与产品部,联合举办了“走进货拉拉”的技术交流活动。货拉拉、万家数科、云集、百丽等多家企业的一线技术专家,就大数据存储、AI等热点话题,深入探讨并…

新的一轮前端面试已来临,避坑指南来 get!

最近看到很多人都在投简历,可是很多人对待面试不够认真,只会等待结果,不去努力。所以整理一些懒人面试技巧给大家。 我们说说目前应用面积最广的 Vue,大厂或是高级工程师面试的时候究竟会碰到什么棘手或是难缠的 Vue 的面试题呢&a…

人工智能 | openai chatgpt 大语言模型

简介 OpenAI 一个美国人工智能研究实验室,由非营利组织 OpenAI Inc,和其营利组织子公司 OpenAI LP 所组成。该组织于 2015 年由萨姆阿尔特曼、里德霍夫曼、杰西卡利文斯顿、伊隆马斯克、伊尔亚苏茨克维、沃伊切赫萨伦巴、彼得泰尔等人在旧金山成立&…

高效数据处理:MapReduce与Hive的实战应用

文章目录 hive分析汇总互联网日志分析1.项目需求2.数据说明3.算法思路 用户电影推荐1.项目需求2.数据说明3.算法思路4.解题步骤 简单数据统计WordCount数据说明 疫情数据分析1.项目需求2.数据说明step1:创建ods层数据表step2:创建dwd层数据表step3:创建d…

selenium的webdriver常用方法和属性介绍(2)

selenium的webdriver介绍 从selenium导入webdriver模块,在pycharm中跳转webdriver模块的__init__.py文件,内容如图所示:从selenium包的子目录中导入了很多模块并做了重命名,用于支持如下 Chrome/Edge/Ie/Firefox/Safari浏览器。 使…

Codigger Keyboard Look应用说明

Keyboard Look是一项专为Desktop设计的功能模式,旨在通过全面启用键盘操作,减少对鼠标依赖,从而提升用户的工作效率和操作体验。尤其对于频繁使用键盘的用户,如开发者,此模式可显著加速日常操作,优化工作流…