ChatGPT 速通手册——不同相似度算法的分值介绍

不同相似度算法的分值介绍

在信息大暴涨的今天,人类已经不可能出现通才、全才式的人物。利用 ChatGPT 来询问我们未知领域的知识是很好的习惯和用法。但对严肃知识的学习,一定要通过权威来源复核审校,保证自己所学知识的正确。否则,很有可能牛头不对马嘴,在行家面前贻笑大方。

本节以笔者一次自身经历为例,展示 ChatGPT 在统计学方面的"大愚若智"。希望大家在各种有严格定义、有唯一正确解读的场景下,多想想,多看看,不要过度相信 ChatGPT。

笔者在查阅 Elasticsearch 新功能变更说明时,发现一个名为 significant_terms 的聚合函数,新引入了几种不同的相关性指标供切换选择,但文档里给出的都是首字母缩写。分别是:JLH score、Mutual information、Chi-square、GND。

尽管对 Elasticsearch 有十年使用和维护经验,在 AI 领域也有一些常见认知,这几个缩写里还是有一半不认识。这时候,自然可以问 ChatGPT:

看起来很棒,ChatGPT 知道所有 4 种相关性指标,并给出了通俗简单的原理解释和适用场景。

不过要实际把功能应用在业务中,肯定还得知道这几种指标的更多细节,比如相关度的强弱如何判定?是单调递增的,还是有开闭区间的?我们还得再问问:

ChatGPT 也给出了回答,看起来好像没啥问题。那进一步再明确一点:对于有 0-1 区间的,是否有具体的强相关、弱相关、不相关阈值标准可以方便业务代码使用?

ChatGPT 依然给出了回答,对于 GND 指标,0-0.2 属于强相关,0.2-0.5 属于弱相关,0.5-1 属于不相关。

到此为止,问题似乎已经得到了答案,体验丝滑,结果完美。但是仔细一看,怎么前后两次,ChatGPT 对 GND 的取值含义说明是相反的?第一次说取值为 0 时最相关,第二次说取值为 0 时最不相关?看来我们还是要自己费点功夫,逐一搜索一下这几个相关度指标,注意可能需要用英文名称。结果出人意料,ChatGPT 给出 0-1 取值范围的两次说明,都是错误的!

首先,JLH score 的计算方法是:

(foregroundPercentage / backgroundPercentage)

  • (foregroundPercentage - backgroundPercentage)

其中 foregroundPercentage 表示待检验数据在指定小集合内的百分比,backgroundPercentage 则是其在全体集合内的百分比。所以我们一眼可以看出,只要 backgroundPercentage 的百分比够小,JLH score的取值肯定远远大于 1。ChatGPT 说的取值范围 0-1 是错的!

其次,GND 的维基百科中介绍,其实际取值范围是 0 到正无穷大,且越接近 0,相关度越高,当值为 1 时,已经可以认为很不相关了。但并没有找到任何强弱性的阈值说明。所以,ChatGPT 关于 GND 的取值范围回答是错误的,而关于强弱阈值的建议也是随意编造!

如果不加审核,直接按 ChatGPT 输出进行应用规划,给出的推荐结果,很可能就南辕北辙了,对业务运营影响巨大。可以说正好匹配上 cohere 三原则的第二条。因此,对这种敏感知识,我们还是要多加小心,不要轻信 ChatGPT。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23358.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

亚马逊僵尸获取的三种方法 你正在使用哪一种?

亚马逊做跟卖的话是很简单便捷,不用自己大费周章的编写产品的listing 只需要找到一些合适的产品进行跟卖就可以了,还可以找到僵尸产品进行跟卖,我们常用的获取僵尸产品的三种方法; 第一种就是最原始的在亚马逊的商品页去找僵尸产品…

new bing 初体验:辅助看论文刚刚好

1. new bing使用条件 (1)安装Microsoft edge的dev版本 https://www.microsoft.com/zh-cn/edge/download?formMA13FJ (2)浏览器侧栏打开 Discover (3) 进入new bing 页面 侧栏展示 new bing 如果这一步,没有聊天功能…

在课堂上使用ChatGPT的三种创意方法

泰晤士世界大学排名. 自1910年从泰晤士报的一个高等教育专栏开始,经过100多年的建设和转变,泰晤士现已是一所世界大学大数据分析的国际机构,同时是获奖无数的国际高教传媒,每日及时报道各国各领域的高教发展趋势和走向。 在课堂上…

ChatGPT的横空出世,带给教育的冲击有多大?

最近很火的ChatGPT想必大家都有所耳闻,短短数日就占据了各大热搜榜单,或许我们无法明晰商业的浪潮,也对技术原理知之甚少,但它的功能却强大到让人叹为观止。 它可以写文章,可以做预算,可以编写代码……甚至…

腾讯工程师聊ChatGPT技术「文集」

想知道 ChatGPT 玩法、核心原理、搭建体验流程、最新竞品吗? 近期,美国人工智能研究机构 OpenAI 发布了最新的大语言模型 ChatGPT,其惊艳的性能在海内外掀起了一波又一波热潮。腾讯云开发者「热技解读」专栏特邀专家,从多方面分享…

2023 Chatgpt php源码

首次使用配置: 请访问 http://你的域名/key.php 配置您的API_KEY列表,程序将全局自动循环调用。默认用户名:admin,默认密码:admin2023。默认用户名密码可以在key.php文件中修改。 本项目完全开源,是PHP版…

GPT-3.5 也能直接联网了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! ChatGPT 常令人诟病的一个问题,就是它的模型训练数据,迄今为止用的还是 2021 年的老数据。 对于当下这个信息大爆炸时代,相隔两小时,消息都有…

ChatGPT进一步联网,距离成为超级流量入口还有多远?|数智焦点

备受瞩目的ChatGPT联网功能又更进一步。 继三月首次推出插件功能(Plugin)后,本周ChatGPT再次更新,将向Plus用户开放约70个第三方插件,覆盖购物、餐饮、旅行、天气、运算、翻译、分析数据等多种功能。 一个多月前&…

OpenAI 刚刚宣布了海量更新

OpenAI 刚刚宣布了海量更新,增加函数调用,支持更长上下文,价格更低! ​新模型上架 1、gpt-4-0613 2、gpt-4-32k-0613 3、gpt-3.5-turbo-0613 4、gpt-3.5-turbo-16k 部分模型降价 1、text-embedding-ada-002:$0.00…

申请GPT-4插件,等待GPT-4插件候补全过程

前言 GPT4相信大家都知道它的升级是带来更多惊喜的,目前GPT4已经推出了网页和插件功能,这些插件是专门为语言模型设计的工具。插件可以帮助 ChatGPT 访问最新信息、运行计算或使用第三方服务。写文记录一下,如果你现正好有需要GPT-4 插件的需求,也可以参考一下。 过程 这…

Linux系统性能监控命令系列之 lsof

大家好!我是Sean! 继续咱们的Linux系统中的性能监控命令,今天要分享的是lsof。 lsof (list open files) (一个列出当前系统打开文件的工具) 在linux环境下,万物皆文件,通过文件不仅仅可以访问常规数据,还…

Docker

1.概念 容器和虚拟机比较: 容器是在操作系统层面上实现虚拟化,直接复用本地主机的操作系统,而传统方式则是在硬件层面实现。 与传统的虚拟机相比,Docker优势体现为启动速度快、占用体积小。 2.安装及配置 2.1安装在centos7中 …

Android:编译libevent动态库并移植jni中,在Android AVD虚拟机上实现一个http服务器

libevent源码:libevent-2.1.8-stable Android Studio版本:Android Studio Electric Eel | 2022.1.1 Patch 2 AVD虚拟机为x86. https://developer.android.google.cn/studio/run/emulator-networking?hlzh-cn#connecting 大体步骤: 1.在ws…

超级超级好用的浏览器扩展插件

良心亲测,绝对好用 1. AdBlock —最佳广告拦截工具(拦截广告) 2.AIX智能下载器(图片/视频/音乐/文(下载图片、视频) 3.Allow Copy 超级复制&AI智能小...(复制文案) 4.EndNote Click - Forme…

菜谱APP源码和设计报告

《移动互联开发》 课程作业 学 院: 班 级: 学 号: 姓 名: 日 期: 设计要求(提交文档时需删除): 1.本课程设计作为《Android 程序设计》的期末考查内容。 2.任务安排: &…

实测:GPT -3.5 与GPT -4.0 编程能力对比

在本文中,我们将从三个不同角度对比GPT-4和GPT-3.5的代码能力,包括:技术概念解释、代码编写能力和调试代码能力。这将有助于我们了解这两个版本的人工智能语言模型在各方面的优劣。 推荐人 | 互联网老孙 编辑者 | JK 1. 技术概念解释对比 问题…

官方 gpt3.5, gpt4.0、github copilot chat、gpt3.5 api、gpt4 api 对比

这是「进击的Coder」的第 848 篇技术分享 作者:刘志军 来源:Python 之禅 “ 阅读本文大概需要 9 分钟。 ” gpt4 的智能程度大于 gpt3.5,毫无争议,但是 OpenAI 提供的 GPT3.5 API 能力是否和官方的 GPT3.5 相当?对应…

刺激,GPT4/ChatGPT3.5/DALL-E同时玩

GPT4/ChatGPT3.5/DALL-E: AI创想师 ​ 这个画图效果着实可以 用来回答某某的问题GPT4确实比GPT3.5准 ​ 这是GPT4的回答 ​ 这是GPT3.5的回答,确实差一些 用了几天,发现可以一直(bai)用(piao)!!!

这套源码融合了chatgpt3.5、chatgpt4.0、midjourney、stable diffusion等技术,简直是炫酷至极

首先,让我们来看下面的效果演示图: 经过实际体验,这套chatgpt技术提供了令人惊艳的快速响应。整个系统可以在国内服务器上部署,只需配置好反向代理功能。 midjourney和stable diffusion在运行过程中表现得十分稳定。而且&#xff…

用OceanBase试了一下ChatGPT开源文档问答助手

欢迎访问 OceanBase 官网获取更多信息:https://www.oceanbase.com/ 随着去年年底 ChatGPT 的火爆出圈,到近日 OpenAI 发布了最新的 GPT-4 模型,大家都在思考、尝试如何利用 ChatGPT 的能力来构建自己的应用。 我们最近发现,在开…