Chat GPT4来了,它和3.5区别在哪?李宏毅机器学习笔记

听说GPT4模型更大、参数更多,功能更强,具体它好在哪里?

GPT4真的能看懂图片吗?

官方回答:不太能~~

下面这张图片是将两个不存在的网址输入进GPT4,问它看到了什么,结果发现GPT真的会胡言乱语,它会根据网址中出现了“man”这个单词,就说他看到了“一个拿着手枪的男人。。。巴拉巴拉

明显就是在胡编乱造!

而如果网址中出现了“girl”这个单词,GPT又会说他看到了“一个穿着校服的女孩子。。。巴拉巴拉”

依然是在胡言乱语!

 所以,GPT4能够读懂图片的结论还是存在疑问的。

GPT4的考试能力大幅提升

另一方面,与3.5相比较起来,GPT4在很多方面的能力都有显著提升!尤其是法考、GRE考试等级考试中的成绩明显突出,下图展示了GPT4和GPT3.5在各种考试中考取分数与所有参与考试人员比较的结果:

如下图所示:

注:柱状条高度:代表GPT在对应的考试中,超越了百分之多少的考生。

GPT4依然给不出鸡兔同笼的正确答案

 

从这两个图片(上方是GPT4,下面是GPT3),我们可以发现:GPT4的答案更加收敛or固定,GPT3.5的答案比较发散,而这也许就是GPT4的答案相对更加准确的原因——收敛到一个正确的答案上了。

GPT4的另外一个大的进步:它学会了更多种冷门、不常用的语言

GPT4知道自己 “不懂” 吗?——GPT4在瞎说的时候,会不会心虚?

测试结果证明了,GPT4在与人类交谈之前,它对自己答案的信心高低与答案正确概率是成正比关系的——它大部分情况是知道自己在胡言乱语的

那么,回到一开始的问题——如何让GPT4读懂图片呢?

Chat GPT是一种基于自然语言处理技术的文本生成模型,它并不具备直接读取图片的能力。但是,有几种方法可以间接的让他读懂图片!

第一种方法: 

我们可以使用图像识别技术将图片转化为文字描述,然后将这些文字描述输入到Chat GPT中,让它根据描述生成相应的回答。

例如,假设我们有一张图片是一只狗在草地上玩耍。我们可以使用图像识别算法将这张图片转化为文字描述,比如"一只棕色的狗在绿草地上玩耍",然后将这个描述输入到Chat GPT中,让它根据这个描述回答有关这个场景的问题,比如"这只狗属于什么品种?"或者"这个场景发生在哪里?"等等。这样,Chat GPT就可以通过文字描述来理解图片所表达的内容并做出回答。

第二种方法

OCR(Optical Character Recognition)即光学字符识别,是一种将图像中的文字自动转换为可编辑格式的技术。OCR的原理是将扫描或拍摄的图像进行预处理,如灰度化、二值化、去噪等操作,然后进行分割,将每个字符分离出来,接着对每个字符进行特征提取,最后将提取的特征与字库中的字符进行比对,找到最佳匹配字符。

第三种方法

Image encoder是一种将图像转换为向量表示的模型;在自然语言处理中,图像编码器的作用是将图像转化为文本表示形式,使得自然语言模型(例如循环神经网络、Transformer等)能够处理图像信息。这种图像转换的文本表示可以直接输入到自然语言模型中,与文本数据进行融合,从而让模型能够更好地理解图像所传达的信息。

关于图像如何编码成向量的细节和具体实现,如果您有兴趣,李宏毅老师推荐您阅读下面这篇论文

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7050.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI菜鸡浅谈ChatGpt

最近最火的话题可能就是Chatgpt ,这个对话机器人横空出世,大大突破了人类之前对AI 对话机器人的认知和预期,上次这样的颠覆认知的突破还是7年前的阿法狗,但是这一次Chatgpt 带来的革命可能要更深远。我从以下几个方面来谈一下我对…

关于ChatGPT八个技术问题的猜想

本文转载自知乎:张家俊 原文链接:https://zhuanlan.zhihu.com/p/606478660 本文约5000字,建议阅读5分钟 对于ChatGPT表现案例的总结已经非常多了,这里主要总结一下自己对ChatGPT技术问题的一些思考。 看到ChatGPT的华丽诞生&#…

【MOSS】首个开源免费的「中国版ChatGPT」MOSS!全新插件系统,能上网,会鸡兔同笼——复旦开源

GitHub - OpenLMLab/MOSS: An open-source tool-augmented conversational language model from Fudan University An open-source tool-augmented conversational language model from Fudan University 目录 🗒️ 开源清单 模型 数据

阿里版ChatGPT「通义千问」邀请测试,我们第一时间试了试

机器之心报道 机器之心编辑部 ChatGPT 赛道,真正的竞逐开始了。 没有一点点预告,阿里版的 ChatGPT 语言大模型来了。 4 月 7 日下午,阿里云突然宣布自研大模型开启企业邀测,模型名为「通义千问」。 官方非常低调,表示…

ChatGPT 究竟在做什么?它为何能做到这些?(1)

ChatGPT能够自动生成一些表面上看起来像人类写出的文字的东西,是一件很厉害且出乎大家意料的事。那么,它是如何做到的呢?又是为何能做到呢?我在这里想大致介绍一下ChatGPT的内部机理,然后探讨一下为什么它能很好地生成…

只有我一个人对ChatGPT感到蕉绿吗?

卷友们好,我是rumor。 上周四,在国内公众号还没刷屏的时候,我就看到ChatGPT发布的消息了,当时迅速看了下博客内容,心想「就这?」,这不跟DeepMind的Sparrow一样吗?而且设计的还没它好…

90%的留学生都在用ChatGPT写毕业论文?

ChatGPT终于火到中文圈了! 在这两个月ChatGPT已经从少数人关注的“新鲜玩意儿”,发展成让欧美大学如临大敌的“论文神器”。这究竟是怎么回事呢? 在教育领域,根据一项针对18岁以上学生的调查显示,89%通过ChatGPT完成作…

chatgpt赋能python:Python卡了怎么办:一位有10年编程经验工程师的实用建议

Python卡了怎么办:一位有10年编程经验工程师的实用建议 Python是一门强大的编程语言,它以其简单易懂、灵活多变和高效的特性,成为了全球各个领域中广泛使用的工具。但是,即使是最出色的编程语言,也难免会遇到卡顿的情…

巧用ChatGPT 解决 Hbase 快照方式读性能优化问题

一、背景 最近公司采用Hbase scan 的方式,经常性会遇到任务跑不出来region 读取超时,由于scan 全量数据,合计行数10个亿,列数接近500。根据建议方案,改为Hbase 快照读方式,避免给region 造成过大压力 二、…

npm安装时卡在sill idealTree buildDeps,npm安装卡在一个地方不动

造成上述问题的原因是因为node的默认安装环境在国外,因此我们只需要修改下镜像的地址即可 1、采用taobao的镜像地址,进入cmd之后输入: npm config get registry 3、此时可以继续输入之前的npm install 命令 npm install 附加知识&#x…

【鸡汤里面的干货】农村娃娃毕业不到四年在深圳核心地段安家置业的背后是什么在支撑?

大家好啊,我就是那个【天涯何处无知己,人穷陌路勿担忧】的架构师李肯! 架构师李肯(全网同名) 在深圳白手起家,毕业不到4年实现一线城市核心地段的安家梦,从0开始谱写励志人生!一个专…

【LLMs系列】90%chatgpt性能的小羊驼Vicuna模型学习与实战

一、前言 UC伯克利学者联手CMU、斯坦福等,再次推出一个全新模型70亿/130亿参数的Vicuna,俗称「小羊驼」(骆马)。小羊驼号称能达到GPT-4的90%性能 github 地址: GitHub - lm-sys/FastChat: An open platform for training, servi…

如何让chatgpt给我们实现一个桌面便签?

我: 用Java开发一款桌面便签软件。功能需求:1、便签可以钉在桌面任意角落;2、便签内容实时保存到本地;3、有新增按钮,点击新增时清除当前面板上的内容,新建一条新的便签内容,并保存到本地&#…

ChatGPT - 小试牛刀 - 试水排序算法

在网上找了几家国内的chagpt镜像,最后还是没忍住上车了,试了一下传说中的写代码能力,果然鸟得很。 不废话直接上图: 上面的测试地址是 唠嗑么ChatGPT国内镜像网站,从站点上也能看到ChatGPT的能力了,什么写…

九龙证券|通信巨头火了!地产板块异动拉升,龙头获主力资金追捧

今天,11个职业取得主力资金净流入。 今天沪深两市主力资金净流出106.7亿元,其中创业板净流出27.79亿元,沪深300成份股净流入18.55亿元。 申万一级职业中,今天有25个职业上涨,房地产职业涨幅居首,达3.69%&a…

火爆全网的chatGPT,究竟是什么东西?

ChatGPT似乎用一夜的时间,让人们记住了无所不能的它!它是谁,凭什么有如此魅力?甚至让拥有ChatGPT概念的股票,接连封板? 下面我们先来对它做个了解。 简单来说,ChatGPT就是由人工智能研究实验室&…

今天我们来浅谈一下ChatGPT到底是什么东西

这是一篇非学术专业性的文章,而我也是为了解chatGPT而学了两三天人工智能,所以哪里写的不好的不对的地方还希望海涵。 图灵测试 1950年,人工智能之父艾伦图灵提出乐“图灵测试”。就是说当你在不面对面的时候跟机器人进行文字聊天的时候&…

chatgpt赋能python:Python怎么考期末:优秀SEO建议

Python怎么考期末:优秀SEO建议 考试是每个学生都要经历的事情,无论是小学生还是大学生。 期末考试让我们感觉像是在面对一堵墙,需要克服无数困难。 如今,我们的目标是给大家提供一些关于如何考Python期末考试的SEO建议。 第一步…

chatgpt赋能python:如何高效地准备期末Python考试,轻松地过关!

如何高效地准备期末Python考试,轻松地过关! 作为一名有10年Python编程经验的工程师,我想与大家分享一下如何高效地准备期末Python考试,轻松地过关。 1. 复习基础语法知识 Python是一门高级语言,其语法特点简洁明了&…

期末复习【嵌入式系统】

期末复习【嵌入式系统】 前言推荐期末复习推荐题型押题复习总述问题与思考:教学内容介绍 问题与思考第1章 嵌入式系统基础问题与思考 1.1 引言1.2 嵌入式系统的概述1.2.1嵌入式系统的定义1.2.2嵌入式系统组成1.2.3嵌入式系统的特点1.2.4嵌入式系统应用 1.3 嵌入式处…