AI大模型基石:文字与数字的起源与演变

AI大模型基石:文字与数字的起源与演变


1、文字

1.1、起源

  我们的祖先在还没有发明文字和语言之前就已经开始使用“咿咿呀呀”的声音来传播信息了,比如在野外活动遇到危险,然后发出“咿咿呀呀”的声音来提醒同伴小心,同伴在接收到信息后首先要做的就是解码,从“咿咿呀呀”中解读想要传递的信息。
  对发明并掌握文字的现代人来说,只是将祖先的“咿咿呀呀”替换成了象形文字和楔形文字,但是其本质都是为了传递信息。之所以会诱导我们的祖先发明文字,是因为其掌握的信息越来越多、语言越来越丰富和越来越抽象,人类大脑已经很难记住这么多的词汇,最终我们的祖先为了高效的记录信息,便走上发明文字的道路。
image.png
  约在公元前3400年左右,苏美尔人发展出了楔形文字,这是目前已知的最早的完整文字系统之一。楔形文字最初是以图画为基础,但很快就发展成为一种表意和表音的混合系统。这种文字系统在美索不达米亚地区(伊拉克境内)广泛使用,并由腓尼基人传播到其他地区。
  在甲骨文(公元前14世纪)出现的前约两千年(公元前24世纪左右),古埃及文明已开始使用图形表示事物,形成了最早的象形文字。无论是甲骨文还是古埃及的象形文字早期文字的数量都是和想要记录的信息相关,由于人类掌握的信息越来越多,象形文字就从刚开始的几百个,渐渐发展成几个千。此时的先祖们又一次站在的推动历史进程的拐点,开始了第一次对象形文字的归纳总结,从而就出现了一词多义的多义词、一词多音的多音词等等。
  高度概括又带来了难理解和歧义,不同的人接收到同一段文字可能会做出不同的解读。为了解决这样的问题就只能依靠上下文,其可以解决大多数歧义(除非估计捣乱)。我们阅读古籍看见的下面的标注,其实就是后人结合上下文按照自己理解进行去歧义的过程。

1.2、本质

  从文明古国文字起源不难看出都是因为随着对世界的认识越来越丰富,带来的信息也越来越多,原有记录信息和传播信息的方式已经不能满足当下需求不得不做出的演进。各文明古国在历史上相互隔绝,在没有交流沟通的前提下形成了不同的文字,但是其文字背后的本质都是为了记录所见所谓、所思所想的信息。
  我们把时间线拉到秦始皇统一六国之前春秋战国时期,在秦始皇还没有统一六国之前各国都有自己的文字和语言,各国之间商贸之所以能正常进行,正是因为在文字的本质是信息这个大前提下产生了翻译。当下翻译很常见,中英互翻和中法互翻等等,同样也没有逃过文字只是信息的载体,而非信息本身的底层本质。

2、数字

2.1、起源

  文字的出现是因为我们祖先掌握越来越多的信息导致大脑不能有效的记住这些信息,那么数字的出现也是因为我们祖先掌握的东西越来越多,只是这里的东西换成了财产。在远古时期我们的祖先拥有的财产可能就只有身上的几片树叶,根本没有到需要数一数的地步,所以就用不上数字,但是随着生产力的提高和部落的出现个人拥有的财产也随之增长,此时就到了需要数一数才能搞清楚自己有多少财产的时候了。
  正如一则小故事,两个部落首领要比一比谁说的数字大,A首领想了想说3,B首领因为家境贫寒想了半天没能想出比3大的数字,并说你赢了。由此数字的发明就是为了记录财产等需要数一数才能清楚有多少的东西。
  我们的祖先早期就是通过掰手指来数数,刚学加减法时候的我们也是如此,恰好人类双手有十根手指,便有了我们日常使用的十进制,如果人类手指不是十根,那么我们现在可能使用的就是其它进制的计数系统了。但是玛雅文明并没有使用十进制,而是将脚趾的十根也加了进来形成了二十进制,从而玛雅文明的计数法就和其他文明在本质上就有了区别,这可能也是玛雅文明如此神秘的原因之一吧。十多年前关于2012年世界末日的传说也是对玛雅文明技术系统的误解和夸大,玛雅人使用二十进制那么他们的日历系统也是基于二十进制的“长计数历”,并从公元前3114年8月11日玛雅文明的创世日期开始计算,正好到2012年12月21日为一个长计数历结束,所以这个日期只是表示一个周期结束和新周期的开始,而不是世界的终结。

2.2、发展

  约在35000年前人类就有了计数系统,但是所有古文明的计数系统在1、2、3的记录方式都是采用简单书写的几横(中国)、几竖(罗马)或者几点(美索不达米亚)。因为我们的祖先使用十进制的计算系统,那么在记录大数字的时候就又有编码的过程,如中国使用个十百千万亿兆来表示进位,罗马则使用相对复杂的系统来表示进位。
  同样是逢十进一中国使用十百千万亿兆来进行编码,然后使用乘法的规则进行解码,如一百万写法的含义就是110010000。而罗马使用“I代表1、V代表5、X代表10、L代表50、C代表100、D代表500、M代表1000”的系统来进行编码,然后使用加减法的规则进行解码(小数字出现在大数字左边为减、右边为加),如IV表示5-1=4,VI表示5+1=6,二者一比较高下立判。
  虽然中国和罗马在数字都有自己的独特发明,但是最高效的还是印度人发明由阿拉伯人传播包含0在内的10个阿拉伯数字,因为其便利性进而推过为全世界通用的数字计数系统。阿拉伯数字具有高度的抽象性,它很好的将文字和数字进行了分离,而不是像中国和罗马那么在文字上创造数字使得二者高度耦合。


一键三连,让我的信心像气球一样膨胀!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/306179.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GEE数据集——1986年—2022年加拿大全国烧毁面积综合数据 (NBAC)

简介 加拿大全国烧毁面积综合数据 (NBAC) 全国烧毁面积综合数据 (NBAC) 是一个地理信息系统数据库和系统,用于计算自 1986 年以来每年全国范围内烧毁的森林面积。这些数据用于帮助估算加拿大的碳排放量。烧毁面积是通过评估一系列可用数据源确定的,这些…

废品回收小程序推动回收行业的发展趋势

回收在全球都是一个重要行业,它为全球的环保作出了重要贡献。 随着科技的不断发展创新,废品回收的方式也逐渐多样,全新的线上回收小程序也逐渐出现在大众的生活中,在当下的手机时代,线上回收也为大众提供了更加便利的…

vs2022启动cmake项目(qt+c++)

1.本工程,如图,1个cmakelist.txt3个文件 2.启动vs 3.选择文件夹 4.进入这个页面,就说明配置没问题 5.启动 6.最后会自己生成其他文件

本地MinIO存储服务通过Java程序结合cpolar实现远程连接上传文件

文章目录 前言1. 创建Buckets和Access Keys2. Linux 安装Cpolar3. 创建连接MinIO服务公网地址4. 远程调用MinIO服务小结5. 固定连接TCP公网地址6. 固定地址连接测试 前言 MinIO是一款高性能、分布式的对象存储系统,它可以100%的运行在标准硬件上,即X86等…

idea 卡怎么办

设置内存大小 清缓存重启 idea显示内存全用情况 右下角

适配器模式类图与代码

某软件系统中,已设计并实现了用于显示地址信息的类Address,现要求提供基于Dutch语言的地址信息显示接口。为了实现该要求并考虑到以后可能还会出现新的语言的接口,决定采用适配器(Adapter)模式实现该要求,得到如图7.9所示的类图。 【Java代码…

Docker操作容器打包(commit),压缩(save),挂载(load)

文章目录 前言一、容器打包二、将镜像压缩成tar包三、将tar包挂载为镜像结束 前言 将容器打包成镜像时,你正在将应用程序及其所有依赖项、文件和配置文件捆绑到一个可移植的、独立的单元中。这样做可以确保您的应用程序在不同环境中具有一致的运行方式,…

ASUS华硕ROG幻16Air笔记本电脑GU605M原装出厂Win11系统工厂包下载,带有ASUSRecovery一键重置还原

适用型号:GU605MI、GU605MY、GU605MZ、GU605MV、GU605MU 链接:https://pan.baidu.com/s/1YBmZZbTKpIu883jYCS9KfA?pwd9jd4 提取码:9jd4 华硕原厂Windows11系统带有ASUS RECOVERY恢复功能、自带所有驱动、出厂主题壁纸、系统属性联机支持…

Linux磁盘空间问题排查记录

问题 pip install时总提示OSError(28, ‘No space left on device’)或者ERROR: Could not install packages due to an OSError: [Errno 28] No space left on device 分析 很明显,磁盘空间不足。尝试了以下方法,没有解决问题: 清理pip缓…

【论文阅读笔记】Attention Is All You Need

论文小结 这是17年的老论文了,Transformer的出处,刚发布时的应用场景是文字翻译。BLUE是机器翻译任务中常用的一个衡量标准。 在此论文之前,序列翻译的主导模型是RNN或者使用编解码器结构的CNN。本文提出的Transformer结构不需要使用循环和卷…

左总视角:千视以NDI 6重塑实时流媒体传输格局

欧洲当地时间4月3日下午1点,NDI 官方宣布了NDI 6.0版本的正式上线。凭借原生HDR和10比特/12比特色彩支持,NDI 6将NDI源的画质处理推向了一个新的巅峰,成为了高画质行业内容创作者的首选。此外,跨互联网现在也可以通过内嵌到SDK组件…

sysbench MySQL性能测试

目录 1. QPS&&TPS 1.1 数据库启动到现在的运行时间(秒) 1.2 查询量 1.3 status命令直接显示出QPS 1.4 每秒输出数据库状态(累加) 2. sysbench 测试工具 3. OLTP MySQL测试 3.1 普通参数 3.2 支持的lua脚本 3.3 脚本参数 3.4 测试数据准备 3.5 进行测试 3.…

蓝桥杯-数组切分

问题描述 已知一个长度为 N 的数组: A1,A2,A3,...AN 恰好是1~ N的一个排列。现 在要求你将 4 数组切分成若干个 (最少一个,最多 N 个)连续的子数组,并且 每个子数组中包含的整数恰好可以组成一段连续的自然数。 例如对于 4 1,3,2,4,一共有 5 种切分方法: 1324:每个单独的数显然…

Java 中文官方教程 2022 版(四十六)

原文&#xff1a;docs.oracle.com/javase/tutorial/reallybigindex.html 定义简单的通用类型 原文&#xff1a;docs.oracle.com/javase/tutorial/extra/generics/simple.html 这里是包java.util中接口List和Iterator的定义的一个小节选&#xff1a; public interface List <…

盲人独立购物新纪元:一款实时“障碍物识别”应用助力超市之行

作为一名资深记者&#xff0c;我始终热衷于探寻科技如何助力特殊群体跨越生活挑战的创新实践。近日&#xff0c;一款名为蝙蝠避障专为盲人设计的辅助应用走进了我的视野&#xff0c;它凭借实时障碍物识别功能&#xff0c;助力视障人士独立前往超市购物&#xff0c;悄然改变了他…

【JAVA基础篇教学】第五篇:Java面向对象编程:类、对象、继承、多态

博主打算从0-1讲解下java基础教学&#xff0c;今天教学第五篇&#xff1a;Java面向对象编程&#xff1a;类、对象、继承、多态。 在Java中&#xff0c;面向对象编程是一种常用的编程范式&#xff0c;它以类和对象为核心&#xff0c;通过继承和多态等机制实现代码的复用和灵活…

十四款大型语言模型在《街头霸王III》中一决雌雄

上周在旧金山举办的Mistral AI黑客马拉松上&#xff0c;开发出了一款基于经典街机游戏《街头霸王III》的人工智能&#xff08;AI&#xff09;基准测试。这款名为“AI Street Fighter III”的开源基准测试由Stan Girard和Quivr Brain开发&#xff0c;游戏在模拟器中运行&#xf…

【C++】——list的介绍及使用 模拟实现

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 目录 文章目录 前言 一、list的介绍及使用 1.1 list的介绍 1.2 list的使用 1.2.1 list的构造 1.2.2 list iterator的使用 1.2.3 list capacity 1.2.4 list element access 1.…

数据结构基础 ——数组VS链表(二)

一、数组 数组对应的英文是array&#xff0c;是有限个相同类型的变量所组成的有序集合&#xff0c;数组中的每一个变量称为元素。数组是最简单、最常用的数据结构。 数组存储格式&#xff1a; 在Python语言中&#xff0c;并没有直接使用数组这个概念&#xff0c;而是使用列表(…

Transformer模型-encoder编码器,padding填充,source mask填充掩码的简明介绍

今天介绍transformer模型的encoder编码器&#xff0c;padding填充&#xff0c;source mask填充掩码 背景 encoder编码器层是对之前文章中提到的子层的封装。它接收位置嵌入的序列&#xff0c;并将其通过多头注意力机制和位置感知前馈网络。在每个子层之后&#xff0c;它执行残差…