解放生产力!用Python结合GPT-4进行编程(上)

用GPT-4和Python自动处理枯燥的工作,通过让AI在几秒钟内编写Python代码来加快日常工作流程。

微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩

2023年3月14日,OpenAI推出了GPT-4,这是OpenAI最新、最强大版本的语言模型。

在推出后的短短几个小时内,GPT-4让人们惊呆了,它把一张手绘的草图变成了一个功能性的网站,通过了律师考试,并生成了维基百科文章的准确摘要。

它在解决数学问题和回答基于逻辑和推理的问题方面也超过了它的前辈GPT-3.5。

ChatGPT是建立在GPT-3.5之上并向公众发布的聊天机器人,以“一本正经的胡说八道”而闻名。它会产生看似正确的回答,并以“事实”为自己的回答辩护,尽管这些回答错误百出。

在该模型坚持认为大象蛋是所有陆地动物中最大的蛋之后,一位用户在Twitter上发帖称:

而且它并没有就此罢休。该算法继续用虚构的事实来证实它的回答,几乎让人相信了一会儿。

另一方面,GPT-4被训练得较少出现“胡说八道”。OpenAI的最新模型更难欺骗,也不像以前那样自信地频繁生成假话。

为什么用GPT-4实现工作流程自动化?

数据科学家的工作会要求能找到相关的数据源,预处理大型数据集,并建立高度准确的机器学习模型,以推动业务价值。

数据科学家每天花大量时间从不同的文件格式中提取数据并将其整合到一个地方。

在2022年11月ChatGPT首次推出后,一位数据科学家希望通过聊天机器人为日常工作流程提供一些指导。使用这个工具来节省花在琐碎工作上的时间——这样他就可以专注于提出新的想法并创建更好的模型。

GPT-4发布后,他很好奇它是否会对他正在进行的工作产生影响。使用GPT-4比它的前辈们有什么明显的好处吗?它能帮助用户节省比使用GPT-3.5更多的时间吗?

这篇文章将展示如何使用ChatGPT来实现数据科学工作流程的自动化,并且将创建相同的提示,并将其输入GPT-4和GPT-3.5,看看前者是否确实执行得更好,并能节省更多时间。

如何访问ChatGPT?

如果想了解和尝试在本文中做的一切,需要访问GPT-4和GPT-3.5。

GPT-3.5

GPT-3.5在OpenAI的网站上是公开可用的。只需导航到https://chat.openai.com/auth/login,填写所需的详细信息,就可以访问语言模型了:

图片来自ChatGPT

GPT-4

另一方面,GPT-4目前是需要每月付费才能使用的。要访问该模型,需要通过点击“升级到Plus”升级到ChatGPTPlus。

每月有20美元的订阅费用,可以随时取消:

图片来自ChatGPT

如果不想支付每月的订阅费用,也可以选择加入GPT-4的API等待名单。一旦获得了对API的访问权,就可以按照这个指南(点击查看)在Python中使用它。

如果目前没有访问GPT-4的权限也没关系。

仍然可以使用ChatGPT的免费版本来学习本教程,该版本在后端使用了GPT-3.5。

用GPT-4和Python实现数据科学工作流程自动化的3种方法

1.数据可视化

在进行探索性数据分析时,用Python生成一个快速的可视化,往往能有助于更好地理解数据集。

不过,这项任务可能会非常耗时 —— 特别是当不知道使用什么正确的语法来获得所需的结果时。

经常发现自己在Seaborn的大量文档中搜索,并使用StackOverflow来生成一个Python图。

让我们看看ChatGPT是否可以帮助解决这个问题。

在本部分中将使用Pima Indians Diabetes dataset(皮马印第安人的糖尿病数据集)。如果想了解和尝试ChatGPT生成的结果,可以下载该数据集。

下载完数据集后,使用Pandas库将其加载到Python中,并输出dataframe的前几行:

import pandas as pddf = pd.read_csv('diabetes.csv')
df.head()

这个数据集中有九个变量。其中Outcome告诉我们一个人是否会患糖尿病的目标变量。其余的是用于预测结果的独立变量。

好的,所以本文想看看这些变量中哪些对一个人是否会患糖尿病有影响。

为了达到这个目的,可以创建一个簇状条形图来可视化数据集中所有因变量中的变量“糖尿病”。

这其实很容易编码出来,但让我们从简单的开始。随着文章的不断深入,我们将继续讨论更复杂的提示。

用GPT-3.5进行数据可视化

由于付费订阅了ChatGPT,该工具允许在每次访问时选择想使用的基础模型。

首先将选择GPT-3.5:

图片来自ChatGPT Plus

如果没有订阅,可以使用ChatGPT的免费版本,因为在默认情况下聊天机器人使用GPT-3.5。

现在输入以下提示,用糖尿病数据集生成一个可视化:

我有一个包含8个自变量和1个因变量的数据集。因变量Outcome,告诉我们一个人是否会患糖尿病。

自变量Pregnancies(妊娠)、Glucose(血糖)、BloodPressure(血压)、SkinThickness(皮肤厚度)、Insulin(胰岛素)、BMI(身体质量指数)、DiabetesPedigreeFunction(糖尿病患者的血糖水平)和Age(年龄)被用来预测这一结果。

你能生成Python代码按结果来可视化所有这些自变量吗?输出应该是一个由Outcome变量着色的簇状条形图。总共应该有16个条形,每个自变量有2个条形。

以下是该模型对上述提示的响应:

有一点很明显的是,该模型假设我们想从Seaborn导入数据集。因为我们要求它使用Seaborn库,所以它可能就做出了这个假设。

这不是一个很大的问题,只需要在运行代码之前修改一行。

下面是GPT-3.5生成的完整代码片段:

import seaborn as sns
import matplotlib.pyplot as plt# 加载数据集
dataset = pd.read_csv("diabetes.csv")# 创建条形图
sns.barplot(x="variable",y="value",hue="Outcome",data=pd.melt(dataset, id_vars=["Outcome"]),ci=None,
)# 设置标题和标签
plt.title("Dependent Variables by Outcome")
plt.xlabel("Independent Variables")
plt.ylabel("Value")# 显示图表
plt.show()

可以将其复制并粘贴到Python IDE中。

以下是运行上述代码后生成的结果:

这个图表看起来很完美!它正是我在ChatGPT中输入提示时所设想的样子!

然而,一个突出的问题是,这张图表上的文字是重叠的。将通过输入以下提示来询问模型是否可以帮助解决这个问题:

该算法解释说,可以通过旋转图表标签或调整数字大小来防止这种重叠。它还生成了新的代码来帮助实现这一目标。

运行这段代码,看看它是否能带来理想的结果:

import seaborn as sns
import matplotlib.pyplot as plt# 加载数据集
dataset = pd.read_csv("diabetes.csv")# 创建条形图
sns.barplot(x="variable",y="value",hue="Outcome",data=pd.melt(dataset, id_vars=["Outcome"]),ci=None,
)# 设置标题和标签
plt.title("Dependent Variables by Outcome")
plt.xlabel("Independent Variables")
plt.ylabel("Value")# 将X轴的标签旋转45度,并将水平对齐方式设置为右侧
plt.xticks(rotation=45, ha="right")# 显示图表
plt.show()

上述代码行应该生成以下输出:

这看起来非常好!

通过简单地看这个图表,我现在对数据集有了更好的理解。看起来似乎葡萄糖和胰岛素水平较高的人更容易患糖尿病。

另外,注意到DiabetesPedigreeFunction变量在这个图表中没有给我们提供任何信息。这是因为该特征的比例较小(介于0和2.4之间)。如果想进一步尝试使用ChatGPT,可以提示它在一个图表中生成多个子图来解决这个问题。

用GPT-4进行数据可视化

现在把同样的提示输入GPT-4,看看是否会得到不同的回答。将在ChatGPT中选择GPT-4模型并输入与之前相同的提示:

请注意,GPT-4并没有假设我们将使用Seaborn中内置的dataframe

它告诉我们,它将使用一个名为dfdataframe来构建可视化,这是对GPT-3.5生成的响应的一种改进。

以下是这个算法生成的完整代码:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt# 假设你的DataFrame被称为df,首先,你需要对DataFrame进行融化,使它适合于创建一个簇状条形图
melted_df = pd.melt(df,id_vars=["Outcome"],var_name="Independent Variable",value_name="Value",
)# 创建簇状条形图
plt.figure(figsize=(12, 6))
sns.barplot(data=melted_df,x="Independent Variable",y="Value",hue="Outcome",ci=None,
)# 自定义绘图
plt.title("Independent Variables by Outcome")
plt.ylabel("Average Value")
plt.xlabel("Independent Variables")
plt.legend(title="Outcome", loc="upper right")# 显示该图
plt.show()

上述代码应该会生成以下图形:

这真是太完美了!

尽管我们没有要求它这样做,但GPT-4已经包含了一行代码来修改图的大小。这个图表上的标签都是清晰可见的,所以我们不必像之前那样回去修改代码。

这比GPT-3.5所产生的响应要高一个档次。

然而,总体看来,似乎GPT-3.5和GPT-4在生成代码以执行数据可视化和分析等任务方面都很有效。

需要注意的是由于用户不能向ChatGPT的界面上传数据,所以用户应该向模型提供数据集的准确描述以获得最佳结果。

推荐书单

《Python人工智能》

本书系统地介绍了基于Python平台的人工智能的原理及实现过程,全书共7章。第1章“从这里开始认识Python”,介绍人工智能及Python 基础知识;第2章“Python 语法基础”,通过生动有趣的实验实例介绍Python编程语法知识;第3章“Python 程序设计”,以实例为基础,介绍Python 的编程方法;第4 章“数据结构”,通过范例介绍列表、元组、字典、集合、函数等数据结构的使用方法;第5章“数据库及应用”,主要介绍Python数据库应用及Web应用开发技术,通过实例讲解Python数据库应用;第6章“大数据应用”,基于实例,主要介绍网络爬虫、Excel数据爬取及分析处理等技术,了解数据挖掘分析处理等大数据应用技术的一般设计流程;第7 章“人工智能”,以具体实例讲解照片人脸识别、图像识别、视频人脸识别、聊天机器人、微信语音聊天机器人、图文识别、语音识别及花朵识别等人工智能深度学习技术。

本书图文并茂,示例丰富,讲解细致透彻,介绍深入浅出,章后练习精广,具有很强的实用性和可操作性,适合初学或自学Python的学生,可作为中小学STEM 教育或培训机构的人工智能课程教材,也可作为大中专院校人工智能、软件工程、计算机等专业以及相关课程的教材或参考书,还可以当作全国计算机二级(Python)考试的教材使用。

《Python人工智能》(刘伟善)【摘要 书评 试读】- 京东图书京东JD.COM图书频道为您提供《Python人工智能》在线选购,本书作者:,出版社:清华大学出版社。买图书,到京东。网购图书,享受最低优惠折扣!icon-default.png?t=N658https://item.jd.com/12854912.html

精彩回顾

《如虎添翼,6个让你效率翻倍的ChatGPT插件》

《还没搞懂GPT-4,AutoGPT就来了!一文帮你速通AutoGPT》

《大模型技术的根基,解读注意力机制论文《Attention Is All You Need》和代码实现(下)》

《大模型技术的根基,解读注意力机制论文《Attention Is All You Need》和代码实现(上)》

《真实对比,OpenAI ChatGPT与谷歌Bard大比拼》

《深入浅析,一步步用GPT打造你的聊天机器人》

微信搜索关注《Python学研大本营》,加入读者群

访问【IT今日热榜】,发现每日技术热点

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/41180.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt赋能python:Python图片线条:提升你网站的视觉效果和SEO排名

Python图片线条:提升你网站的视觉效果和SEO排名 引言 在当今世界,互联网已成为人们获取信息的主渠道,网站的规模和复杂度也呈指数级增长。在这种情况下,如何让你的网站在众多搜索结果中更加突出,吸引更多的访问者是一…

深度学习使用sketch-code 草图、手稿自动生成HTML前端页面

之前在知乎上看到一篇文章 标题是 《从草图到HTML只需5秒》,好奇点进去看了一会。 顿时惊了。这是一个使用手稿来生成HTML页面的项目,非常有意思。 具体原文在此:从草图到HTML只需5秒 如图片这样,只要一张手绘图,就可…

chatgpt赋能python:Python手绘:让编程画画更有趣

Python 手绘:让编程画画更有趣 作为一名资深的 Python 工程师,我不仅在编程领域里拥有丰富的经验,还深深地热爱着手绘。尤其是通过 Python 手绘,我发现这门编程语言不仅可以用来创造出强大的软件系统,还能让我们在绘画…

第12章项目质量管理

项目质量管理包括把组织的质量政策应用于规划、管理、控制项目和产品质量要求,以满足干系人目标的各个过程。此外,项目质量管理以执行组织的名义支持过程的持续改进活动。项目质量管理需要兼顾项目管理与项目可交付成果两个方面,它适用于所有…

上海交大教授何援军:论工业软件发展的若干问题

何援军,上海交通大学计算机系教授、博士生导师。主要研究方向:CAD,计算机图形学。几何计算的理论、算法和软件等。1992年7月被中国船舶工业总公司授予“有突出贡献中青年专家称号”。同年10月起享受政府特殊津贴。“九五”期间任上海市CAD应用…

国内人力资源管理软件的低代码应用

随着企业数字化转型的推进和人力资源管理的逐步精细化,HR系统越来越被重视。许多企业纷纷采购了各种功能强大的HR系统,然而,这些系统常常需要在充分理解业务流程和用户需求的前提下进行细致定制。这不仅需要一定的技术储备,还需要…

当HR软件系统开始低代码

随着企业数字化转型的推进和人力资源管理的逐步精细化,HR系统越来越被重视。许多企业纷纷采购了各种功能强大的HR系统,然而,这些系统常常需要在充分理解业务流程和用户需求的前提下进行细致定制。这不仅需要一定的技术储备,还需要…

HR软件市场中的低代码

低代码是一种通过可视化方式创建应用的平台,能够提高开发效率、降低开发难度。为了适应快速发展需求,一些主流 HR 系统厂商开始引入低代码能力和工具。而 HR 软件市场应用低代码的前景如何?低代码能如何帮助 HR 市场呢?让我们通过…

什么是渲染?一文看懂,萌新赶紧收藏码住!

十四五规划提出“加快数字化发展,建设数字中国”,数字技术的快速发展,从起初的内容创建到最终的效果呈现,都离不开渲染技术。目前,渲染技术被广泛应用于教育、医疗、影视动画、建筑设计等多个领域。它能有效满足用户对…

团队沟通利器之UML——活动图

在平时的项目开发中,可能有的团队对业务都是用口头在团队里面进行交流,有时程序员的理解跟老大表达的意思不一致,还有 其他等等的弊端就不说了。我们知道建筑工人都是按照图纸做事的,同样在软件开发中,我们应该也有这…

【AIGC】1、爆火的 AIGC 到底是什么 | 全面介绍

文章目录 一、AIGC 的简要介绍二、AIGC 的发展历程三、AIGC 的基石3.1 基本模型3.2 基于人类反馈的强化学习3.3 算力支持 四、生成式 AI(Generative AI)4.1 单模态4.1.1 生成式语言模型(Generative Language Models,GLM&#xff0…

基于微信小程序的旅游系统源码

开发环境及工具: 大等于jdk1.8,大于mysql5.5,idea(eclipse),微信开发者工具 技术说明: springboot mybatis 微信小程序 代码注释齐全,没有多余代码,适合学习(毕设)&a…

【Pyecharts|GEO-Lines】全球航线图的绘制

前言 航线图是基于Echarts官网的示例航线图通过Pyecharts来实现的,当然由于Pyecharts还是诸多限制,并不能100%还原。 本次实现了全球机场分布图和航线图效果(支持切换航司): 全球机场分布 航线图动图效果 相关代码和数据都已经上传至我的Github,可以访问下载:https://…

视觉与多模态大模型前沿进展 | 2023智源大会精彩回顾

导读 6 月 9 日下午,智源大会「视觉与多模态大模型」专题论坛如期举行。随着 stable diffusion、midjourney、SAM 等爆火应用相继问世,AIGC 和计算机视觉与大模型的结合成为了新的「风口」。本次研讨会由智源研究院访问首席科学家颜水成和马尔奖获得者曹…

【通览一百个大模型】GLM(THU)

【通览一百个大模型】GLM(THU) 作者:王嘉宁,本文章内容为原创,仓库链接:https://github.com/wjn1996/LLMs-NLP-Algo 订阅专栏【大模型&NLP&算法】可获得博主多年积累的全部NLP、大模型和算法干货资…

【论文写作】《ChatGPT六步提问法:你若诚心发问,它会给你一篇惊艳论文!》- 知识点目录

《ChatGPT六步提问法:你若诚心发问,它会给你一篇惊艳论文!》

chatgpt赋能python:10年Python编程经验带你畅玩Python编程游戏APP

10年Python编程经验带你畅玩Python编程游戏APP Python是一种高级编程语言,具有易懂、易学、易用等特点,被广泛应用于科学计算、数据处理、Web开发和人工智能等领域。而Python编程游戏APP则是近年来Python社区中新兴的一类应用,它以游戏化的方…

chatgpt赋能python:Python搜题app:提高学习效率的利器

Python搜题app:提高学习效率的利器 在学习过程中,遇到难题是不可避免的。而如何高效地解决这些问题呢?Python搜题app应运而生,它是一款基于Python编写的提高学习效率的利器。在这篇文章中,我们将介绍这款神奇的搜题ap…

chatgpt赋能python:有没有可以搜Python题目的软件?

有没有可以搜Python题目的软件? 如果您是一名Python程序员,您可能会发现在项目中遇到过各种各样的编码问题。与此同时,您也可能希望在不同的练习和考试中提高您的编程能力。在这些情况下,您需要一个便捷的方式来寻找Python编程问…

chatgpt赋能python:使用Python进行题目搜索:提高效率,精确切中目标

使用Python 进行题目搜索:提高效率,精确切中目标 在当今数字时代,互联网上充斥着大量的资料和文献,其中包括数以百万计的题目。对于学生和研究人员来说,题目是学习和研究的重要组成部分。然而,由于海量题目…