让 chatGPT-4 帮我设计一个分布式缓存系统,从尝试到被我逼疯!

ChatGPT狂飙160天,世界已经不是之前的样子。

新建了人工智能中文站https://ai.weoknow.com
每天给大家更新可用的国内可用chatGPT资源


比 ChatGPT 背后 GPT-3.5 更为强大的模型 GPT-4,已正式对外发布。在 OpenAI 官方发布的 GPT-4 Developer Livestream(https://www.youtube.com/watch?v=outcGtbnMuQ)视频中,我们亲眼见证了 OpenAI CTO Greg Brockman 演示了 GPT-4 将一张手绘草稿架构图变成一个现实可滑动的网站;同时,它也能帮助我们直接生成代码,甚至当我们把代码运行报错的界面截一个图发给 GPT-4 时,它就能给出相应的解决方案提示。

这种直接对标程序员饭碗的工具,在日常开发场景下,生成的代码是否真的可用?如果说 ChatGPT 达到了 Google L3 级别工程师,能拿到 18.3 万美元的薪资,那么 GPT-4 处于一个什么样的编码地位?

近日,前 Google 软件开发工程师、现任 IT 在线学习平台 Scaler 的教学系统设计师 Naman Bhalla 模拟了 GPT-4 去参加 Uber 这类公司面试会遇到的问题,其以“设计一个分布式缓存系统”为主题,探讨 GPT-4 在面试环节中的表现情况。

目前,他还把包含所有测试用例的完整代码放到 GitHub 上公开了出来:https://github.com/Naman-Bhalla/lldassignments/tree/master/src/main/java/dev/naman/lldassignments/casestudies/distributedcache/solution

整体而言,在写需求、回答问题、写代码环节中,GPT-4 能力达到普通工程师级别。不过,在测试用例环境,GPT-4 似乎失去上下文的逻辑性,甚至一度把自己搞懵。

接下来,我们将分享 Naman Bhalla 测试的全过程。

面试环节第一步——回答问题,写软件需求

软件项目开发过程中,对于程序员而言,实施软件开发的基础就是要先写一份软件需求说明。

因此,在开始时,Naman Bhalla 提出要求 GPT-4 ——“为 Uber 构建一个分布式缓存,给我写一份问题需求。”

一句话之后,GPT-4 快速地给出了标题、问题描述、具体的要求:

标题:Uber 的分布式缓存系统

问题描述:

设计并实现一个分布式缓存系统,可以有效地存储和管理 Uber 服务的数据。该缓存应支持高可用和可扩展的架构,以满足 Uber 不断增长的对快速和高效数据检索的需求。

要求:

1.设计一款分布式缓存系统,可以支持以下操作:

a. Put(key, value): 将键值对存储在缓存中。

b.Get(key):如果它存在于缓存中,检索与给定键相关的值。

c.Delete(key):从缓存中删除与给定键相关的键值对。

2.缓存应该有一个可配置的大小(键值对的数量)和一个可配置的生存时间(TTL,Time to live)。当缓存达到最大容量时,系统应该删除最近使用最少的项目(LRU)来为新的项目腾出空间。

3.确保缓存分布在多个节点上,以提高可扩展性和可用性。设计系统能够良好地处理节点故障和网络分区。

4.实施一致性散列的机制,将键值对均匀地分布在缓存的各个节点上。

5.系统应该支持水平扩展。它应该很容易地从缓存中增加或删除节点,而不会有明显的停机时间或数据损失。

6.为数据的一致性和容错性实施读和写的法定人数。该系统应该能够处理并发的读和写,而不会造成数据的不一致。

7.包括监控和记录功能,可以跟踪高速缓存系统的健康和性能。

8.设计一个简单的用户界面或命令行界面来与缓存系统进行交互,允许用户执行诸如放、取和删除等操作

9.编写测试案例来验证缓存系统的正确性和可靠性

GPT-4 能够说出基本要求,准确度也不错。可以说,过了第一关。

紧接着,Naman Bhalla 针对分布式缓存中一些经典的问题进行了提问,比如:“如何确保代码中支持类似于读取自己的写入数据(Reading your own writes)的一致性问题?”、“缓存可以支持哪些功能?是不是包括一些优化、可扩展性和对客户可用性的保证?”

对于提供一些文字解答方面,GPT-4 给出的答案都很充分,还列出了多个小点,便于大家很直观地看出回答的错与对。

针对第一问时,其答复道:

读取自己的写入数据(Reading your own writes)的一致性保证了一旦客户端进行了写操作,所有来自同一客户端的后续读操作都会返回更新的数据。为了保证分布式缓存系统的这种一致性水平,你可以实施以下策略:

1. 基于 Session 的方法。

2. 客户端缓存。

3. 粘性路由。

4. 读后写的一致性。

5.版本管理或时间戳。

6. 因果一致性。

第二个问题,GPT-4 回答,“缓存可以支持各种功能、优化和保证,以提高它的性能、可扩展性和对客户的可用性。其中一些功能包括驱逐策略、生存时间(TTL)、数据一致性、缓存分区、缓存复制、缓存的持久性等等”。

面试环节第二步——上手写代码

当问题以不错的结果完成之后,接下来,所谓是骡子是马,拿出来溜溜,由此也进入了程序员岗位最为重要的实操环节——写代码。

Naman Bhalla 给出的要求是,让 GPT-4 用 Java 编写一个分布式缓存的代码,支持以下要求:

值得注意的是,上文解答过程中,足以让 GPT-4 能够把 Naman Bhalla 提出的 5 项要求弄懂。

不过,当拿到最新写代码需求时,GPT-4 首先还是有些懵,其表示,“由于问题的复杂性和和响应格式的限制,我不能提供分布式缓存系统的完整代码。但是,我可以给你一个系统组件的大纲和一些代码片段,由此可以帮助你开始实施这个系统。你可以根据你的要求修改和扩展这些代码片段。”

于是它提供了四个部分的代码片段:

1. CacheNode

2.DistributedCache

3. ConsistentHashing

4. CacheClient

当然,这对于想要“坐享其成”的程序员而言,未必是一个好消息,大家都想要拿来就能用的代码,必然不想听到只给代码片段的回复。

因此,当 Naman Bhalla 继续要求 GPT-4 实现 CacheNode 的完整代码时,GPT-4 还是满足了他的小心思,提供了完整的算法和代码:

除了 CacheNode 这部分的代码之外,Naman Bhalla 相继得到了 GPT-4 提供的 DistributedCache、ConsistentHashing、EvictionStrategy(接口以及LRU 和 LFU 实现)的代码。

不知道什么原因,GPT-4 决定不再提供关于 Request Collapsing、Async Processing、Prefetching 的代码。不过,如果进一步跟它提要求,支持这些功能时,它还是嗒嗒嗒地敲下了这些代码。

当然,在这过程中,站在程序员的角度来看,想要 GPT-4 生成的代码即可用,首先要看得懂这些代码,知道分布式缓存系统实现的具体逻辑,否则,缺失哪一块都不知道,更别论拿着代码去运行了。

测试用例

完整的代码有了之后,便进入了写测试用例的时候了。Naman Bhalla 直接要求 GPT-4 编码每个部分的 junit 测试示例。

GPT-4 的回复是:

为了测试 DistributedCache 的实现,我们将创建一个名为"DistributedCacheTest "的 JUnit 测试类。这个测试类将涵盖以下情况:

1. 测试基本的 put 和 get 功能。

2. 测试删除功能。

3. 测试添加和删除一个缓存节点。

4. 测试请求合并。

5. 测试 prefetching。

很显然,GPT-4 知道要测试哪些用例,也写了正确的测试用例。

不过,它并没有写最后一个关于 prefetching 的测试用例。因为它的逻辑没有被定义。为此,GPT-4 提供了一些建议,如「你需要在 DistributedCache 类中实现 prefetchKeys 方法,该方法根据给定的键生成一个 prefetch 的键列表。一旦你实现了这个方法,你就可以添加一个测试案例来验证 prefetch 是否按预期工作。」

承接上文,Naman Bhalla 建议 GPT-4 还是自己直接给出一个自定义 prefetch 的示例。不出意料,GPT-4 照做了,然后实现了测试。

Naman Bhalla 表示,由于在面试过程中,面试官经常问程序员如何在代码中支持 XXX。于是,他本着好奇的性子,就问 GPT-4 在实现中如何支持读取自己的写入数据(Read your own writes)。

Naman Bhalla 注意到,GPT-4 所写的一个测试用例是不稳定的,因为它产生了非确定性的输出。由于并发性,它产生了非确定性的输出。当 Naman Bhalla 进一步向 GPT-4 问了这个问题,它很快就纠正了错误。

然而,当要求 GPT-4 实现对给定线程的密钥请求的粘性,以确保没有一致性问题。

GPT-4 答复道:“为了确保每个键的请求都进入同一个线程,你可以在 CacheNode 类中使用`ExecutorService`创建一个线程池。每个键将根据其散列代码被散列到一个特定的线程,以确保对一个特定键的所有操作都由同一个线程执行。”

事实上,它提出了一个非最佳的 ExecutorService,但告诉 Naman Bhalla 最佳的解决方案是什么,并且也进行了编码。

不知何故,GPT-4 在这里开始发狂了。开始不断重复自己的代码,而不是完成代码。另外,ExecutorService 的实现是错误的。它没有扩展超类,也没有实现它的所有方法。

当 Naman Bhalla 要求 GPT-4 修复这个问题时,“它似乎已经疯了”,Naman Bhalla 无奈地说道。

因为,GPT-4 不仅没有修复上面的问题,反而又创建了一个新的 Cache 类,它基本上在做与 CacheNode 相同的工作。Naman Bhalla 称,最初认为 GPT-4 这样做可能是为了提高代码质量。但似乎它已经开始忘记上文了,再次定义了许多先前已经定义的类。

为了让 GPT-4 回归正轨,Naman Bhalla 复制粘贴了它之前写的 CacheNode 的代码,并要求它为新的 ExecutorService 修改它。

最终,GPT-4 虽然犯了一些错误,但在提示下得到了修复。修复完成之后,Naman Bhalla 又要求 GPT-4 再写一些测试用例来全面测试。特别是针对并发请求。但由于 GPT-4 已经开始失去上文背景,所以它不可避免地又犯了错误,Naman Bhalla 不得不告诉它之前写的代码。

几经折腾,GPT-4 终于实现了正确的测试用例:

写在最后

整体而言,GPT-4 提供了完整的分布式缓存系统代码,其能力处于一个不错的水平。不过,距离理想中的一键就能生成可用的代码,还有很长的距离,仍然需要程序员从中不断提供“提示语”,并优化纠错。


ChatGPT狂飙160天,世界已经不是之前的样子。

新建了人工智能中文站https://ai.weoknow.com
每天给大家更新可用的国内可用chatGPT资源

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/49510.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI | 一秒生成专属动漫头像

随着人工智能的发展,想要把自己的照片变成动漫已经不是难题了,各种APP层出不穷,刷抖音应该经常看到一秒变身漫画少女的特效视频,这些都要归于人工智能。 随着国庆的到来,你的假期靓照可以动漫式的秀一波了。 今天就来…

Python使用AI photo2cartoon制作属于你的漫画头像

Python使用AI photo2cartoon制作属于你的漫画头像 1. 效果图2. 原理3. 源码参考 git clone https://github.com/minivision-ai/photo2cartoon.git cd ./photo2cartoon python test.py --photo_path images/photo_test.jpg --save_path images/cartoon_result.png1. 效果图 官方…

AI一分钟就能生成个性动漫头像?分享一个超好用的AI卡通头像生成器

你是否常常在社交媒体或短视频平台上看到一些精美的卡通风格头像,但是找遍全网都找不到完全相同的,其实这些动漫卡通风格的头像大多都是利用AI绘制的,不仅精美漂亮而且独一无二,不会与其他人的头像重复,所以今天就来给…

AI绘图第二弹!绘制专属动漫头像

上次推出AI绘图的文章后,热爱绘画的同志们,积极性很高!文章详情可以点击《最近非常火的AI绘图(附操作方法)》查看 这次,推荐一种绘制自己专属动漫头像的AI绘制方法! 这个AI绘制头像项目&#…

AI免费生成3D卡通头像,真香~

Midjourney 5.1 已经发布,官方搞活动免费送25张图,我用Mid Journey生成了我和孩子们的3D卡通头像,大家看像吗? 整个过程非常简单,只需1分钟: 首先,上传了自己照片 然后输入对照片的描述&#xf…

AI动漫头像生成神器来了

AnimeGANv3是一款二次元漫画风格迁移工具,它的处理能力让我们由衷感叹科技力量之强大:只要挑选到正确的照片,该工具的成像效果真的可以用「惊艳」来形容了,只要有合适的图片,再也不用找人设计头像啦,自己轻…

ChatGPT 能够取代架构师吗?

ChatGPT目前的能力来看,已经可以取代不少岗位了,例如客服、教师、文员等,那是否意味着随着ChatGPT的发展,以后任何岗位都可以被ChatGPT取代呢?比如说有了ChatGPT,架构师还有必要继续存在吗? 我们…

chatgpt赋能python:Python中的关键词提取工具:Jieba

Python中的关键词提取工具:Jieba 在自然语言处理领域,关键词提取是一个非常重要的任务。在Python中,可以使用Jieba库来进行中文分词和关键词提取。本文将介绍Jieba库的用法和功能,以及如何在SEO中使用它提高网站排名。 什么是Ji…

利用pandoc把latex文件转换为word的基本操作

pandoc是很强大的文本转换工具,我是用它来把latex转换为word。弥补了latex不能直接生成word的不足。 具体操作: 首先下载安装pandoc,具体略过 winR之后cmd进入命令行 输入pandoc,不报错,也就说明可以用了 ctrlc退…

chatgpt赋能python:Python复制到word:如何实现高效无误的文档传递

Python复制到word:如何实现高效无误的文档传递 在日常工作中,我们经常需要将Python代码和数据转换到Word文档中共享和展示。然而,Python和Word之间存在着很多兼容性方面的问题,如何实现高效无误的文档传递是我们需要掌握的关键技…

利用IText导出Word

生成Word文档的类库有很多,常用的有jacob,poi,itext等等,jacob操作office的能力是不错的,但是对于我个人来说,我不喜欢它的两方面:一、jacob只能应用于windows平台。二、除了要把相应的ar包加载到类路径下&…

本地Word图文直接复制到富文本编辑器中

当前功能基于PHP,其它语言流程大致相同 1.新增上传word json配置 在ueditor\php\config.json中新增如下配置: /* 上传word配置 */ "wordActionName": "wordupload", /* 执行上传视频的action名称 */ "wordFieldName": &q…

【成为架构师课程系列】怎样进行物理架构、运行架构、开发架构的设计?

我认识一些架构师,他们的生活都是失控的。因为架构天性范围宽广,涉及人、工作量都非常多。一些架构师把他们的时间整天整天的花在跟“项目干系人”开会上,然后夜以继日,再搭上周末去实际的架构工作。 -- Eric Brechner, 《代码之道》 多重软件架构视图之所以必不可少,是因…

如何在一个中文大模型上,加入招投标字段标注的数据,搭建一个招投标字段解析的Transformer模型?

ChatGPT方案1 在一个中文大模型上加入招投标字段标注的数据,并搭建招投标字段解析的Transformer模型可以通过以下步骤实现: 收集并标注招投标相关的数据。可以使用现有的数据集,也可以通过爬虫技术获取相关数据,然后进行人工标注。…

程序员兼职网站(自由职业)

1、程序员客栈 www.proginn.com 2、码市 codemart.com 3、开源众包 4、智城外包 5、实现网 6、猿急送 7、人人开发 8、开发邦 9、电鸭社区 10、快码 11、英选 12、外包大师 13、我爱方案网 14、自由职客 15、智筹 16、SXsorft 17、猪八戒

程序员如何向自由职业过渡

点击上方“程序人生”,选择“置顶公众号” 第一时间关注程序猿(媛)身边的故事 未来一定会是一个从事自由职业越来越多的时代。当我们还不能放手一搏到自由职业中去的时候,我们实际上可以为其做一些准备。当然不是所有人都适合自由…

4大国外自由职业者项目外包网站

4大国外自由职业者项目外包网站 http://www.asfreelancer.com/articles/50.html 2011-06-27 / 分类:推荐专题, 职业资源 / 没有评论 这里介绍四个在国外自由职业圈中很流行的项目外包网站,很多个人和团队都会在上面开始自己的商业服务,尤…

程序员适合做自由职业者吗?

企业基于自身的弹性用工需求,雇佣兼职或自由职业者来解决用人难题,这种灵活用工模式效率更高、成本更低,企业把灵活用工与固定全职结合起来使用,正在变成一种常态。有数据指出,全球灵活用工业务总收入高达3万亿&#x…

如何迅速成为一个能够养活自己的自由职业者?

自由职业者,意味着自己的时间可以自由的安排,不用被强迫996,但是也同时意味着收入的不稳定,特别是在成为自由者的初期。 飞援 平台上也有一些自由职业者活跃,综合他们的经历经验,分享几点建议给想成为自由…