玩转ChatGPT:名单排序

一、写在前面

最近在文秘工作中,碰到一个名字排序的问题,大概的规则:

(1)按照第一个汉字的首字母的英文单词排序,从A-Z;

(2)若第一个字的首字母一致,则比较二个字的首字母,同样是A-Z;

(3)若第二个字的首字母一致,则比较三个字的首字母,同样是A-Z;

想着GPT能否直接生成?下面我们来试一试:

二、尝试过程

(1)先用GPT随机生成30个名字

随机名单如下(这些名字都是随机生成的):

李威廉
张曼
王子
赵星辰
刘晓雨
孙晨曦
周慧
吴子
郑嘉仪
冯雅婷
陈思源
褚建国
卫子轩
蒋昊
沈冰
韩晓飞
杨天佑
朱晓
秦婉
何宇翔
钱晓明
孟春花
黄宇
高晨
杜鸿
文雅琪
赖志强
潘嘉
郭子涵
曾晓

(2)先用GPT-4直接进行排序(不开插件)

写一个咒语:请给{名单}做一个排序,要求:(1)按照第一个字的首字母的英文单词排序,从A-Z;(2)若第一个字的首字母一致,则比较二个字的首字母,同样是A-Z;(3)若第二个字的首字母一致,则比较三个字的首字母,同样是A-Z;

名单为:{};

输出如下:

 可以看到,排序是混乱不堪的,比如第28名,明显不是最后一名。个人觉得可能的两个原因:首先,GPT的数学能力公认的不强;其次,咒语可能写的不好,直接让TA一步到位地输出结果,很容易出错(这个在吴恩达的教程有提到过)。

所以,下一步,我们针对性地进行尝试:

(3)使用Wolfram插件

咒语同上:

可以看到,我的Wolfram插件不知啥原因,并没有正常工作。重复了几次也没有,因此,我放弃了这个选项。

(4)优化咒语(不使用插件)

写一个咒语:请给{名单}做一个排序,要求:(1)按照第一个字的首字母的英文单词排序,从A-Z;(2)若第一个字的首字母一致,则比较二个字的首字母,同样是A-Z;(3)若第二个字的首字母一致,则比较三个字的首字母,同样是A-Z;

名单为:{};

请一步一步地分析,不急着输出答案。

建议步骤:(2)先把中文名字转换成汉语拼音首字母在排序,例如杜鸿转换成DH,第一个字的首字母是D,以此类推;(2)按照第一个字的首字母的英文单词排序,从A-Z;(3)若第一个字的首字母一致,则比较二个字的首字母,同样是A-Z;(4)若第二个字的首字母一致,则比较三个字的首字母,同样是A-Z。

神奇的事情发生了,GPT-4直接说做不了,建议用Python:

然后,我退而求其次,使用GPT-3.5:

是按照步骤来了,但是每一部都有错漏:

 第一个的首字母都提取错了;

 第二步的排序也有问题,再下面就不用看了。

看来GPT在解决这类问题还是不太擅长。

(5)使用Python实现

按照GPT的建议,使用下面代码:

from pypinyin import lazy_pinyin# 名单names = ["李威廉", "张曼", "王子", "赵星辰", "刘晓雨", "孙晨曦", "周慧", "吴子", "郑嘉仪", "冯雅婷", "陈思源", "褚建国", "卫子轩", "蒋昊", "沈冰", "韩晓飞", "杨天佑", "朱晓", "秦婉", "何宇翔", "钱晓明", "孟春花", "黄宇", "高晨", "杜鸿", "文雅琪", "赖志强", "潘嘉", "郭子涵", "曾晓"]# 转换为拼音首字母names_pinyin = [(name, ''.join([p[0][0].upper() for p in lazy_pinyin(name)])) for name in names]# 按照拼音首字母排序names_pinyin.sort(key=lambda x: x[1])# 输出排序后的名字for name, _ in names_pinyin:print(name)

看看输出的结果,大体上应该是对的:

 当然,使用这个规则有一定缺陷,比如“吴子”和“王子”都是“WZ”,又如何排序呢?又比如后面的“卫子轩”是“WZX”,比前面多了一个“X”,又改怎么排?因此,还需要继续优化规则才行。

所以,我想试一试用笔画来排序。

(6)使用笔画排序

写一个咒语:请给{名单}做一个排序,要求:(1)按照第一个汉字的笔画数目排序,从小到大;(2)若第一个汉字的笔画数目一致,则比较二个字的笔画数目,同样是从小到大;(3)若第二个汉字的笔画数目一致,则比较三个字的笔画数目,同样是从小到大;(4)若名字只有两个汉字,则它的第三个汉字定义为0画;

名单为:{};

(a)GPT-4直接说做不了,就算是Wolfram插件也不行,给了Pyhton代码,后面我再使用;

(b)给GPT-4联网,神奇的事情发生了,TA居然去联网去找笔画:

 还不错,就是有点慢,不对,是很慢,因为TA是一个字查的,笑死我了:

工作量实在太大,TA自己也放弃了,这一策略不行。

(c)尝试GPT-3.5:

 思路是对的,但是笔画数错了。

(d)换回Python:

import pypinyinimport unicodedatanames = ["李威廉", "张曼", "王子", "赵星辰", "刘晓雨", "孙晨曦", "周慧", "吴子", "郑嘉仪", "冯雅婷", "陈思源", "褚建国", "卫子轩", "蒋昊", "沈冰", "韩晓飞", "杨天佑", "朱晓", "秦婉", "何宇翔", "钱晓明", "孟春花", "黄宇", "高晨", "杜鸿", "文雅琪", "赖志强", "潘嘉", "郭子涵", "曾晓"]def stroke_count(char):return unicodedata.east_asian_width(char)def get_stroke_count(name):return [stroke_count(char) for char in name]names_strokes = [(name, get_stroke_count(name)) for name in names]names_strokes.sort(key=lambda x: (x[1][0], x[1][1] if len(x[1]) > 1 else 0, x[1][2] if len(x[1]) > 2 else 0))for name, _ in names_strokes:print(name)

看看结果:

报错了:TypeError: '<' not supported between instances of 'int' and 'str'

GPT给的解释在于:计算汉字的笔画数是一个复杂的问题,需要一个完整的汉字-笔画数映射表。这个映射表可以从 Unicode 字符数据库(UCD)或其他类似的数据源获取。我建议你寻找一个包含汉字-笔画数映射表的库,或者使用一个外部的数据源,比如 Unicode 字符数据库(UCD)。

我问TA Unicode 字符数据库(UCD)如何调取?

GPT说:Unicode 字符数据库(UCD)是一个包含了所有 Unicode 字符的各种属性的数据库,包括字符的名称、分类、大小写映射、笔画数等。然而,UCD 并没有提供一个直接的 API 或者函数库来查询这些属性。你需要下载 UCD 的数据文件,然后在你的程序中解析这些文件。

在 Python 中,你可以使用 unicodedata 库来查询一些基本的 Unicode 属性,但是这个库并不包括笔画数。对于笔画数,你可能需要找到一个专门的库,或者自己创建一个汉字到笔画数的映射表。

我建议你查找一些专门的汉字处理库,或者使用一些在线的 API 服务。例如,汉典网(zdic.net)提供了一个查询汉字笔画数的在线服务,你可以在你的程序中调用这个服务。但是,请注意,这可能需要你对网络编程和网页抓取有一些基本的了解。

嗯,听起来很麻烦,我就不继续弄了。

三、关于Token

网上也有测试,就是让GPT把句子倒着输出,TA是不能实现的:

比如说:请按照下面规则进行转换,例如{TA是不能实现的}换成{的现实能不是AT},那么{就是让GPT把句子倒着输出}会转换成什么?

 发现了吧,TA其实是理解规则了“规则似乎是将整个句子的字符顺序反转”,但是,结果是不对的,“输出着倒子句把TPG让是就”,可以看到,“输出”并没有转换过来。因为在GPT看来,“输出”是一个字符。也就是Token,在计算机科学和语言处理中,"Token"(标记)是一个非常基础的概念,它通常指的是一段程序、文本或语句中的一个独立的部分,这个部分在语义上是有意义的。

例如,句子"The cat sat on the mat."可以被分割成这样的Token:["The", "cat", "sat", "on", "the", "mat", "."]。这个过程被称为Tokenization(标记化或分词)。

四、写在最后

基于上述原因,GPT在处理这类问题的时候,往往比较懵逼。可能GPT-4也意识到这个问题,直接推荐用Python来解决吧。当然,TA的数学能力也有待加强,而且TA不能自己运行代码,未来看看使用Code interpreter插件能否解决类似问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20594.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【NLP】ChatGPT 的议论文究竟写的怎么样?111 位高中教师告诉你答案

夕小瑶科技说 原创 作者 | 小戏、Python 在 OpenAI GPT-4 发布时发布的《GPT-4 Technical Report》中&#xff0c;其中很吸引人眼球的一部分是 GPT-4 应用于教育领域的出色表现&#xff0c;通过让 GPT-4 去完成美国的 AP 课程及考试&#xff0c;来评估 GPT-4 在多个学科中的性…

ChatGPT:在商业领域的广泛应用|小智AI

ChatGPT丨小智ai丨chatgpt丨人工智能丨OpenAI丨聊天机器人丨AI语音助手丨GPT-3.5丨OpenAI ChatGPT|GPT-4|GPT-3|人机对话|ChatGPT应用|小智ai|小智ai|小智ai|小智ai|小智AI|chatgpt小智AI 人工智能技术在商业领域的应用正日益普及&#xff0c;而ChatGPT作为下一代智能对话模型…

chatgpt赋能python:用Python办公自动化轻松完成繁琐重复的工作

用Python办公自动化轻松完成繁琐重复的工作 随着科技的进步&#xff0c;许多传统工作已经被自动化取代。而在许多职业中&#xff0c;办公自动化通常被认为是节省时间和减少错误的最佳方法。对于那些使用Microsoft Office&#xff0c;例如Excel、Word和PowerPoint等应用程序的用…

基于用户评论情感分析详细设计与技术实现

基于用户评论情感分析详细设计与技术实现 文章目录 基于用户评论情感分析详细设计与技术实现前言一、技术架构二、分析服务器构建1.1 创建flask项目1.2 编写数据库连接脚本&#xff0c;获取用户评论数据&#xff1b;1.2.1 引入库1.2.2 连接数据库获取数据1.2.3 测试 1.3 编写情…

情感分析的分类,情感分析模型有哪些,情感分析的应用场景,情感分析的发展趋势

1.情感分析的分类&#xff1a; &#xff08;1&#xff09;基于情感极性的分类&#xff1a;将文本的情感分为正向、负向和中性三类。 &#xff08;2&#xff09;基于情感维度的分类&#xff1a;将文本的情感分为喜欢、愤怒、悲伤、惊喜等多个情感维度。 2.情感分析模型&#x…

基于Twitter数据的情感预测与案例分析

导读 本次分享的是关于文本分析中的情感预测分析和主题分析的一个小科研项目&#xff0c;数据爬取自Twitter&#xff0c;主要内容分为3部分&#xff1a; 1.情感预测机器学习模型选择及建立 2.情感预测深度学习模型LSTM的介绍和建立 3.主题分析模型简介 01 # 情感预测机器学习…

CDGP认证|ChatGPT的出现,对数据治理行业冲击如何?

ChatGPT的出现对数据治理有很多好处&#xff0c;其中最明显的是提供了更高效、更准确和更自动化的数据处理和分析服务,可以帮助企业和组织更好地管理和利用数据资源&#xff0c;提高数据质量和决策效率。此外&#xff0c;ChatGPT还能够发现隐藏在大量数据中的信息和趋势&#x…

chatgpt赋能python:Python报错大全

Python报错大全 作为Python程序员&#xff0c;报错是我们经常遇到的一件事情。报错可以帮助我们定位和解决问题&#xff0c;但有时候错误信息并不直观&#xff0c;所以我们需要查找信息来帮助我们解决问题。在这篇文章中&#xff0c;我们将介绍常见的Python报错以及如何解决它…

GitHub开源神器,已获3k star!让你的 ChatGPT 不再报错!感受丝滑般体验!

点击上方“Github爱好者社区”&#xff0c;选择星标 回复“资料”&#xff0c;获取小编整理的一份资料 作者&#xff1a;GG哥 来源&#xff1a;GitHub爱好者社区&#xff08;github_shequ&#xff09; 这是GitHub爱好者社区第 71 篇原创文章 Hello&#xff0c;大家好&#xff0…

登高望远,一文解答 2023 年你最关心的前端热点问题

动手点关注 干货不迷路 本文预计阅读 25 min&#xff0c;建议先收藏后观看~ 一、刀光剑影的 2022 时光荏苒&#xff0c;这绝不平淡的 2022 年已经走上历史的黄页&#xff0c;新的一年也逐渐看不到故人回首的光影。感谢你对前端技术领域持续关注&#xff0c;我们一直在这里等你。…

千模大战鏖战正酣,大模型能否帮360重回巅峰?

ChatGPT问世后&#xff0c;互联网终于看到了变革的曙光。 回望互联网的征程&#xff0c;几乎每十年左右&#xff0c;就会因产品和技术的变革&#xff0c;而催生出全新的应用场景。 00年代&#xff0c;随着PC产品的逐渐成熟&#xff0c;桌面互联网成为时代的“主旋律”。在此背…

司马阅(SmartRead),最好用的中国PDF智能阅读工具!

在数字化时代&#xff0c;大量的信息以PDF&#xff08;便携式文档格式&#xff09;的形式存在。 处理和提取PDF文件中的信息可能是一项繁琐的任务&#xff0c;但现在有了司马阅(SmartRead)&#xff0c;一款能够与PDF进行对话的智能工具&#xff0c;这一切变得更加简单和高效。…

国产开源大模型: 百亿参数“伶荔”,填补中文基础模型空白!

Datawhale开源 团队&#xff1a;深圳大学沈琳琳教授团队 Linly 伶荔说 中文语言大模型来啦&#xff01; 大数据系统计算技术国家工程实验室副主任、深圳大学计算机与软件学院沈琳琳教授团队主持的人工智能项目“伶荔(Linly)”于今天隆重推出“伶荔说”系列中文语言大模型。 该…

Google 中文名发布 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2023 年 4 月 12 日&#xff0c;每年的这一天是世界航天日&#xff0c;全名载人空间飞行国际日&#xff1b;在 1961 年的 4 月 12 日&#xff0c;苏联空军飞行员尤里加加…

chatgpt赋能python:Python用Pi优化SEO的指南

Python用Pi优化SEO的指南 引言&#xff1a; 搜索引擎优化(SEO)已经成为了数字市场营销领域中至关重要的一部分。对于那些想要在数字领域获得成功的企业和个人而言&#xff0c;SEO是不可或缺的。Python是一种优秀的编程语言&#xff0c;现在&#xff0c;它在SEO中也变得越来越…

PDF工具Adobe Arcrobat Pro DC下载安装教程

【ChatGPT】前些天发现了一个巨牛的人工智能学习电子书&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;无广告&#xff0c;忍不住分享一下给大家。&#xff08;点击查看学习资料&#xff09; wx供重浩&#xff1a;创享日记 对话框发送&#xff1a;adobe 免费获取Adobe …

Python | Python的自我介绍(前世今生)

本文概要 本篇文章主要介绍Python这门语言的前世今生&#xff0c;适合刚入门的小白或者想了解Python历史的同学&#xff0c;文中描述很详细&#xff0c;具有一定的学习价值&#xff0c;感兴趣的小伙伴快来一起学习吧。 个人简介 ☀️大家好&#xff01;我是新人小白博主朦胧的…

全网最详细中英文ChatGPT-GPT-4示例文档-从0到1快速入门AI智能问答应用场景——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门AI智能问答应用场景 Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例 其它资料下载 ChatGPT是目前最先进的AI聊天机器人&#xff0c;它能够理解图片和文字&a…

CV不存在了?Meta推出最新AI模型SAM,计算机视觉领域的ChatGPT

4月5日&#xff0c;Facebook母公司Meta在推特宣布推出SAM模型&#xff08;Segment Anything Model&#xff09;并开源。该模型能够查找和分割图像和视频中的任何对象&#xff0c;实现一键抠图。同日&#xff0c;Meta还发布了自称有史以来最大的图像注释数据集&#xff0c;以及3…

canvas绘制微信海报分享

前言 最近公司在做一个面向餐饮的微信小程序&#xff0c;公司希望在小程序中嵌入关注公众号的功能&#xff0c;一开始是采用官方提供的official-account&#xff0c;配置公众号关注组件&#xff0c;方便用户快捷关注公众号&#xff0c;但是这个组件的场景限制比较多&#xff0…