Stephen Wolfram:意义空间和语义运动规律

Meaning Space and Semantic Laws of Motion

意义空间和语义运动规律

We discussed above that inside ChatGPT any piece of text is effectively represented by an array of numbers that we can think of as coordinates of a point in some kind of “linguistic feature space”. So when ChatGPT continues a piece of text this corresponds to tracing out a trajectory in linguistic feature space. But now we can ask what makes this trajectory correspond to text we consider meaningful. And might there perhaps be some kind of “semantic laws of motion” that define—or at least constrain—how points in linguistic feature space can move around while preserving “meaningfulness”?

我们在上文中讨论了,在 ChatGPT 内部,任何一段文本实际上都由一组数字表示,我们可以将其看作是某种“语言特征空间”中的一个点的坐标。因此,当 ChatGPT 继续一段文本时,相当于在语言特征空间中描绘出一条轨迹。但现在我们可以问,是什么使这条轨迹对应于我们认为有意义的文本。或者说,是否可能存在某种“语义运动定律”,定义或至少约束着语言特征空间中的点在保持“有意义性”的同时如何移动?

So what is this linguistic feature space like? Here’s an example of how single words (here, common nouns) might get laid out if we project such a feature space down to 2D:

那么,这个语言特征空间是什么样的呢?以下是一个示例,展示了如果将这样一个特征空间投影到二维时,单个单词(这里是普通名词)可能会如何排列:

e9a030b3734e9d693107aef536e77636.png

We saw another example above based on words representing plants and animals. But the point in both cases is that “semantically similar words” are placed nearby.

我们之前也看到了另一个基于代表植物和动物的单词的示例。但无论哪种情况,关键在于“语义相似的单词”被放置在附近。

As another example, here’s how words corresponding to different parts of speech get laid out:

再举一个例子,这是根据不同词性排列的单词的示例:

1c26995a6db504e45e4581a0c54c68fb.png

Of course, a given word doesn’t in general just have “one meaning” (or necessarily correspond to just one part of speech). And by looking at how sentences containing a word lay out in feature space, one can often “tease apart” different meanings—as in the example here for the word “crane” (bird or machine?):

当然,一个给定的单词通常并不只具有“一个意义”(或者不一定仅对应一个词性)。通过观察包含某个单词的句子在特征空间中的分布,我们通常可以区分出不同的含义——就像这里针对单词“crane”(鸟还是机械?)的例子:

f90ec3fa24157223e62f98140b391bdb.png

OK, so it’s at least plausible that we can think of this feature space as placing “words nearby in meaning” close in this space. But what kind of additional structure can we identify in this space? Is there for example some kind of notion of “parallel transport” that would reflect “flatness” in the space? One way to get a handle on that is to look at analogies:

好的,至少我们可以认为,在这个特征空间中,将“意义上相近的词语”放在空间中的接近位置是合理的。但是我们能在这个空间中识别出什么额外的结构呢?例如,是否存在某种“平行运输”的概念,反映了空间中的“平坦性”?一种解决方法是看类比:

d6919beb917819f44caa049e0273fa76.png

And, yes, even when we project down to 2D, there’s often at least a “hint of flatness”, though it’s certainly not universally seen.

是的,即使我们将其投影到二维,通常也至少有一点“平坦性的迹象”,尽管它肯定并非普遍存在。

So what about trajectories? We can look at the trajectory that a prompt for ChatGPT follows in feature space—and then we can see how ChatGPT continues that:

那么轨迹呢?我们可以看看 ChatGPT 提示在特征空间中遵循的轨迹,然后我们可以看看 ChatGPT 如何继续这个轨迹:

a44aa0c091500c514d9cdb2fb52d7563.png

There’s certainly no “geometrically obvious” law of motion here. And that’s not at all surprising; we fully expect this to be a considerably more complicated story. And, for example, it’s far from obvious that even if there is a “semantic law of motion” to be found, what kind of embedding (or, in effect, what “variables”) it’ll most naturally be stated in.

这里肯定没有“几何上显而易见”的运动规律。这一点一点也不令人惊讶;我们完全预料到这将是一个相当复杂的故事。例如,即使真的存在一条“语义运动定律”,它最自然地是用何种嵌入方式(或实际上是用什么“变量”)来陈述也远非显而易见。

In the picture above, we’re showing several steps in the “trajectory”—where at each step we’re picking the word that ChatGPT considers the most probable (the “zero temperature” case). But we can also ask what words can “come next” with what probabilities at a given point:

在上图中,我们展示了“轨迹”的几个步骤,在每个步骤中,我们都选择了 ChatGPT 认为最可能出现的单词(“零温度”情况)。但我们也可以问,在给定点,哪些词语可能“接下来出现”,以及它们出现的概率是多少:

cc0d252be86450bfbb68161455448e69.png

And what we see in this case is that there’s a “fan” of high-probability words that seems to go in a more or less definite direction in feature space. What happens if we go further? Here are the successive “fans” that appear as we “move along” the trajectory:

在这种情况下,我们看到的是一个在特征空间中大致朝着明确方向的高概率词汇“扇形”。如果我们继续研究呢?以下是沿轨迹“移动”时出现的连续“扇形”:

3c50356bdb3d6687a928e3fd74bbc93d.png

Here’s a 3D representation, going for a total of 40 steps:

这是一个三维表示,总共进行了 40 个步骤:

1114c0a25d7d6bff7bcd46ebd03781f5.png

And, yes, this seems like a mess—and doesn’t do anything to particularly encourage the idea that one can expect to identify “mathematical-physics-like” “semantic laws of motion” by empirically studying “what ChatGPT is doing inside”. But perhaps we’re just looking at the “wrong variables” (or wrong coordinate system) and if only we looked at the right one, we’d immediately see that ChatGPT is doing something “mathematical-physics-simple” like following geodesics. But as of now, we’re not ready to “empirically decode” from its “internal behavior” what ChatGPT has “discovered” about how human language is “put together”.

是的,这看起来很混乱,并且并未特别鼓励人们期待通过实证研究“ChatGPT 在内部做什么”来识别类似“数学物理”的“语义运动定律”。但也许我们只是在看“错误的变量”(或错误的坐标系统),如果我们只观察正确的变量,我们会立即发现 ChatGPT 正在做一些类似于沿测地线运动的“数学物理简单”事情。但到目前为止,我们尚未准备好从其“内部行为”中“实证解码”出 ChatGPT 已经“发现”了关于人类语言是如何“组合”的知识。

d9ce013b0b7f236d9c29e957bdeee6f4.jpeg

“点赞有美意,赞赏是鼓励”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/87754.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【第二阶段】在函数中定义参数是函数的函数

1.理解:在一个函数中有一个参数a,这个参数a又属于一个函数,a即时参数又是函数 2.用kotlin实现登录 /*** You can edit, run, and share this code.* play.kotlinlang.org*/ fun main() {//调用传参//普通参数传入即可,针对在调用函数中的参数函数传入使用…

Android Studio实现Spinner下拉列表

效果图 点击下拉列表 点击某一个下拉列表 MainActivity package com.example.spinneradapterpro;import androidx.appcompat.app.AppCompatActivity;import android.os.Bundle; import android.view.View; import android.widget.AdapterView; import android.widget.Spinn…

关于使用pycharm遇到只能使用unittest方式运行,无法直接选择Run

相信大家可能都遇到过这个问题,使用pycharm直接运行脚本的时候,只能选择unittest的方式,能愁死个人 经过几次各种尝试无果之后,博主就放弃死磕了,原谅博主是个菜鸟 后来遇到这样的问题,往往也就直接使用cm…

差分升级在物联网水表上的实现与应用(学习)

摘要 当越来越多的物联网水表加入抄表系统后,实现了水表数据的信息化,并且当水表终端需要技术更新时,通过网络方式来升级产品可以高效修复设备面临的问题,减少用户损失,降低维护成本,但同时也对有限的网络…

HCIP VRRP技术

一、VRRP概述 VRRP(Virtual Router Pedundancy Protocol)虚拟路由器冗余协议,既能够实现网关的备份,又能够解决多个网关之间互相冲突的问题,从而提高网络可靠性。 局域网中的用户的终端通常采用配置一个默认网关的形…

Leetcode-每日一题【剑指 Offer 12. 矩阵中的路径】

题目 单词必须按照字母顺序,通过相邻的单元格内的字母构成,其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一个单元格内的字母不允许被重复使用。 例如,在下面的 34 的矩阵中包含单词 "ABCCED"(单词中的字母…

f1tenth仿真设置

文章目录 一、安装依赖二、进入工作空间克隆三、编译四、运行 一、安装依赖 tf2_geometry_msgs ackermann_msgs joy map_server sudo apt-get install ros-noetic-tf2-geometry-msgs ros-noetic-ackermann-msgs ros-melodic-joy ros-noetic-map-server 二、进入工作空间克隆…

数据结构刷题训练:设计循环队列(力扣OJ)

目录 文章目录 前言 1. 题目:设计循环队列 2. 思路 3. 分析 3.1 定义循环队列 3.2 创建队列 3.3 判空和判满 3.4 入队 3.5 出队 3.6 取队头队尾数据 3.7 销毁队列 4. 题解 总结 前言 当谈到队列数据结构时,很多人可能会想到普通的队列,即先进…

Python-OpenCV中的图像处理-霍夫变换

Python-OpenCV中的图像处理-霍夫变换 霍夫变换霍夫直线变换霍夫圆环变换 霍夫变换 霍夫(Hough)变换在检测各种形状的技术中非常流行,如果要检测的形状可以用数学表达式描述,就可以是使用霍夫变换检测它。即使要检测的形状存在一点破坏或者扭曲也是可以使…

ThinkPHP8命名规范-ThinkPHP8知识详解

本文主要讲解thinkphp8的命名规范,主要包括:遵循PHP自身的PSR-2命名规范和PSR-4自动加载规范、目录和文件命名规范、函数和类、属性命名规范、常量和配置命名规范、数据表和字段命名规范、不能使用PHP保留字。 在使用thinkphp8开发项目之前,…

Docker安装ElasticSearch/ES 7.4.0

目录 前言安装ElasticSearch/ES安装步骤1:准备1. 安装docker2. 搜索可以使用的镜像。3. 也可从docker hub上搜索镜像。4. 选择合适的redis镜像。 安装步骤2:拉取ElasticSearch镜像1 拉取镜像2 查看已拉取的镜像 安装步骤3:创建容器创建容器方…

【软件测试】Linux环境Ant调用Jmeter脚本并且生成测试报告(详细)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 准备工作 需要在…

Linux驱动-基于Buildroot构建系统镜像后实现基于QT项目开发之环境配置

Linux驱动-基于Buildroot构建系统镜像后实现基于QT项目开发之环境配置 需求BuildRootUboot的仓库地址和commit idKernel 的仓库地址和commit id BuildRoot已编译库在Windows上的Create上创建项目编译QT项目 需求 基于Build root编译整个镜像后,如何开发自己的基于Q…

windows环境下打印机无法打印的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

【资讯速递】AI与人类思维的融合;OpenAI在中国申请注册“GPT-5”商标;移动大模型主要面向to B 智能算力是未来方向

2023年8月11日 星期五 癸卯年六月廿五 第000001号 欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 本文收录于IT资讯速递专栏,本专栏主要用于发布各种IT资讯,为大家可以省时省力的就能阅读和了解到行业的一些新资讯 资…

【BASH】回顾与知识点梳理(十五)

【BASH】回顾与知识点梳理 十五 十五. 指令与文件的搜寻15.1 脚本文件名的搜寻which (寻找『执行档』) 15.2 文件档名的搜寻whereis (由一些特定的目录中寻找文件文件名)locate / updatedbfind与时间有关的选项与使用者或组名有关的参数与文件权限及名称有关的参数额外可进行的…

【图像分类】 理论篇(1) 图像分类的测评指标

对于分类模型的性能评估通常采用混淆矩阵的方式和计算准确率、正确率、召回率和 F1 分数。本文详细介绍图像分类的测评指标 在二分类问题中,样本有正负两个类别,模型对样本的预测结果存在四种组合:真阳性,即预测为正&#x…

Axure RP9小白安装教程

Axure RP 9是一款流行的快速原型设计软件,用于创建交互式原型。它提供了丰富的工具和功能,方便用户设计和演示WEB界面、APP界面以及软件界面等产品的交互效果。Axure RP 9可以帮助产品经理、设计师和开发团队更好地协作,快速验证和改进产品的…

ROS实现自定义信息以及使用

常见的消息包 消息包定义一般如下👇 (1)创建包和依赖项 (2)在新建的qq_msgs的包新建msgs的文件夹,在该文件夹里面新建Carry.msg类型的文件。 其实,Carry.msg就是你自己定义的消息类型&am…