作为一个数据分析师使用ChatGPT的心得

最近一直在研究chatgpt在数据分析领用的实际使用,有几个比较具体的实际案例是我在处理工作中遇到的,给大家分享一下。
一个是在商业领域,经常性的需要写日报周报月报,但到了3月底 还需要一个季度报,而季度报的数据处理是比较多的,因此,我用chatgpt 帮我写了很多个脚本。
在这里插入图片描述
可以看到的是它理解错了

在这里插入图片描述
虽然是很基础的数据合并脚本,但是它能在30秒内给我正确的答案,如果是我自己写,或许需要3-5分钟。

然后我让它帮忙写一个随机森林算法,用于用户分析,并做roc,auc和混淆矩阵的分析。
在这里插入图片描述

# 读取用户数据集
df = pd.read_csv('user_data.csv')# 将数据集中的标签(是否复购)转换为二元分类
df['repurchase'] = np.where(df['repurchase'] == 1, 1, 0)# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(df.drop('repurchase', axis=1), df['repurchase'], test_size=0.2, random_state=42)# 构建随机森林模型
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_train, y_train)# 使用测试集评估模型性能
y_pred = clf.predict(X_test)
y_proba = clf.predict_proba(X_test)[:, 1]
fpr, tpr, thresholds = roc_curve(y_test, y_proba)
auc = roc_auc_score(y_test, y_proba)
confusion_mat = confusion_matrix(y_test, y_pred)# 可视化 ROC 曲线
plt.plot(fpr, tpr, label='ROC curve (area = {:.2f})'.format(auc))
plt.plot([0, 1], [0, 1], 'k--')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve')
plt.legend()
plt.show()# 可视化混淆矩阵
plt.matshow(confusion_mat, cmap='Blues')
plt.colorbar()
plt.xlabel('Predicted label')
plt.ylabel('True label')
plt.title('Confusion Matrix')
plt.show()# 输出分类性能指标
print('Accuracy:', (confusion_mat[0, 0] + confusion_mat[1, 1]) / np.sum(confusion_mat))
print('Precision:', confusion_mat[1, 1] / (confusion_mat[1, 1] + confusion_mat[0, 1]))
print('Recall:', confusion_mat[1, 1] / (confusion_mat[1, 1] + confusion_mat[1, 0]))
print('AUC:', auc)

太长了 我就不截图了,这是AI给出的,基本模型是正确的,但是没有做精度检验
所以我要AI加上网格搜索调优模型,但是AI明显意会错了
在这里插入图片描述

# 导入所需的库
from sklearn.model_selection import GridSearchCV# 定义超参数的网格搜索范围
param_grid = {'n_estimators': [50, 100, 150],'max_features': ['auto', 'sqrt', 'log2'],'max_depth': [5, 10, 20, None],'min_samples_split': [2, 5, 10],'min_samples_leaf': [1, 2, 4],
}# 构建随机森林分类器
clf = RandomForestClassifier(random_state=42)# 定义网格搜索对象
grid_search = GridSearchCV(clf, param_grid=param_grid, cv=5, n_jobs=-1, scoring='roc_auc')# 训练网格搜索对象
grid_search.fit(X_train, y_train)# 输出最佳参数配置和对应的 AUC 分数
print("Best parameters found: ", grid_search.best_params_)
print("Best AUC score: ", grid_search.best_score_)

这里AI很明显没有连续我们上文的结果,所以只单纯的回答了网格搜索,然后由于我很久没有做这种工作了,我忘记了其中的一个参数param_grid是做什么的,我直接就问了AI
在这里插入图片描述
他就直接给我输出了这么多,其实大家看到这里就已经可以知道了,后面的数据分析领域其实更多的会在理论和实践上的积累,只有当你知道了一大堆的分析方法后,你才能调动AI为你完成,因此经验+逻辑将在AI时代远大于技术能力。除非技术做到行业突破的水平。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6814.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

22种大数据分析可视化工具

22种大数据分析可视化工具有哪些?数据可视化工具在软件测试领域中扮演着非常重要的角色。 数据可视化包括数据可视表示的设计和分析。 在当今世界,我们正在处理海量数据,其中对数据可视化软件的需求日益突出,以通过图形,趋势&…

数据可视化系列-06数据分析工具QuickBI

文章目录 数据可视化系列-06数据分析工具QuickBI一文介绍QuickBIQuick BI 的基本对象 快速入门Quick BI产品架构界面说明菜单栏 我的看板工作台首页 通过仪表板分析数据 数据可视化系列-06数据分析工具QuickBI 参考: Quick BI 数据可视化分析平台 QuickBI官方文档 …

独家 | 如何利用ChatGPT自动完成6个数据科学领域的任务

作者:Ahmed Besbes 翻译:陈之炎校对:赵茹萱本文约1400字,建议阅读7分钟本文将用一些涉及机器学习和软件工程的编程问题来挑战ChatGPT。 ChatGPT仿佛是Google、StackOverflow和Readthedocs三者的组合体。 图片由James A. Molnar在“…

TradeGraph媲美交易软件的python量化交易K线工具

之前用python做量化交易,需要画k线和各种曲线等,使用了mpl_finance,但体验太差,不支持拖拽而且性能很差,于是就自己写了个k线图工具TradeGraph,性能可媲美专业的股票软件,运行界面如下图&#x…

跌疯了,理性投资人会这样做 附国内外免费股票数据源

大家好,我是宁一。 最近股市真是跌疯了。 有人打算割肉,有人打算补仓,有人直接躺平。 不管什么打算,很多人的操作,都是毫无章法的,凭着自己的个人感受去加仓,减仓。 所有亏钱的决策都是顺应…

完爆基金经理?ChatGPT炒股,一年多回报率超500%

郑雅烁 中国证券报 2023-05-21 02:48 发表于北京 天天财经独家,速关注 近日,美国顶级公立大学佛罗里达大学金融学院公布的一项研究表明,将ChatGPT融合在投资模型中,可以预测股市的走势,其投资回报率甚至高达惊人的500%…

因去年开发出 ChatGPT,OpenAI 亏损 5.4 亿美元!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 研发具有创新性的 ChatGPT 究竟给其背后的公司 OpenAI 带来了什么? 据 The information 报道,ChatGPT 的诞生不仅给 OpenAI 带来了前所未有的关注度,吸引了微软“多年…

chatgpt赋能Python-python3_7_9怎么换成汉语

Python 3.7.9:如何将其换成汉语? Python是一种流行的编程语言,广泛用于Web开发、科学计算、数据分析和人工智能等领域。而Python 3.7.9是其中的一种版本。但是,对于一些初学者或母语非英语的用户来说,将Python 3.7.9从…

chatgpt赋能python:Python错误代码修复指南

Python错误代码修复指南 作为一名有10年Python编程经验的工程师,我经常遇到各种各样的代码错误。在此,我总结了一些Python代码错误修复的技巧和方法,希望能够帮助Python初学者和开发者更加顺畅地开发和调试Python程序。 确认错误信息 当遇…

ChatGPT API报错 443 解决方案

在国内运行OpenAI库的时候,会出现以下的错误: openai.error.APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool(host‘api.openai.com 5’, port443): Max retries exceeded with url: /v1/engines/davinci/completions (Caus…

ChatGPT都只能, 解释一半的代码, 是啥样的

我发现啊, 有的人还不会用ChatGPT, 真的有点出乎我的认知, 我觉得一些理所应知的事情, 他们不知, 比如, 废话不多说, 我们看看GPT怎么帮我理解代码 ChatGPT读代码 我买了几个掘金小册课程, 有的代码看不懂, 就请ChatGPT帮忙解释 // ./src/server/index.tsx import express …

ChatGPT修bug横扫全场,准确率达78%!网友:程序员要开心了

ChatGPT到底有多会修bug? 这事终于有人正儿八经地搞研究了—— 来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。 除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代…

OpenAI-ChatGPT最新官方接口《错误代码大全》全网最详细中英文实用指南和教程,助你零基础快速轻松掌握全新技术(九)(附源码)

Error codes 错误码 前言Introduction 导言API errors API 错误401 - Invalid Authentication 401 -验证无效401 - Incorrect API key provided 401 -提供的API密钥不正确401 - You must be a member of an organization to use the API 401 -您必须是组织的成员才能使用API429…

ChatGPT 出现重大 Bug、7天还未完全修复, OpenAI 直指 Redis 开源库错误导致

来源:InfoQ 作者:褚杏娟 近日,许多 ChatGPT 用户称,自己在使用 ChatGPT 时看到其他人的聊天查询列出现在了自己的历史记录中。 “这个应用程序正在向我显示其他人的聊天记录和内容。我没有输入任何这些提示或问题。”有推特网友称…

【ChatGPT实战】6.使用ChatGPT自动化生成PPT

如果需要使用ChatGPT生成PPT,我相信看了上一篇Excel教程的读者,就会想到也通过ChatGPT生成VBA代码,再通过运行VBA代码的方式来自动生成PPT。 理论上是可以的,但是当你实际操作的时候会发现很难实现。因为PPT包含的元素实在是太多…

ChatGPT做PPT方案,10组提示词方案!

今天我们要搞定的PPT内容是: 活动类型:节日活动、会员活动、新品活动分析类型:用户分析、新品立项、项目汇报内容类型:内容规划、品牌策划 用到的工具: mindshow 邀请码 6509097ChatGPT传送门(免费使用…

学习笔记借助ChatGPT自动制作PPT

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、两步实现自动制作PPT二、步骤1.通过ChatGPT生成文本文档2.借助MINDSHOW生成PPT 总结 一、两步实现自动制作PPT 文本内容生成:chatGPT自动生成 格式…

零基础让 ChatGPT 帮你做PPT

零基础让 ChatGPT 帮你做PPT: 1.把你的需求描述给ChatGPT,让它写一段vba,需求越清晰越好(需求都说不明白还不如自己做快) 2.打开PPT,在自定义功能区启用【开发者工具】 3.在开发者工具里点击 Visual Basic&…

太强悍了,省了1万块! 足不出户用GPT做英语老师,教孩子学英语!竟然还能做题!...

大家都知道现在学英语已经是一个刚需了。不管是大人还是小孩;不管是学生族,还是上班族都要学英语;而且小孩子学英语更贵!普通的家庭收入不是很高的,面对英语培训这样的刚需非常头疼! 比如大家都知道的英语培…

英语配音软件哪个好?快把这些软件收好

小伙伴们平时空闲的时候,会看一些搞笑的视频来放松自己吗?这些搞笑的视频不仅通过画面,还通过一些搞笑的配音来为我们带来欢乐。其实很多搞笑配音并不是使用真人配音,而是用软件合成的。那你们知道搞笑配音软件哪个好吗&#xff1…