分享一个用AI降本的思路,不懂代码也能上手

如何用AI解决实际的业务问题?

生财圈友@我来利用ChatGPT做算法建模,每年为公司省下6万元。

今天他将分享通过ChatGPT进行数据分析的思路,从最开始定义问题到最终数据论证。

上手的实操过程门槛并不高,但可以实现把官方电商平台的流量指数,转化为真实的销量等我们想要的数据。

希望今天的这篇分享,对大家有所启发。

图片

大家好,我是我来。

最近使用GPT,为公司每年省下了至少6万元。

原因是拟合出生意参谋(淘宝数据)&罗盘策略(抖音数据),行业竞争版块指数与真实值之间的函数关系,帮助公司获取真实的市占率等数据。

希望给大家带来一些思考,如果你能用在自己业务中也降低成本就更好了。

有一些数据分析的逻辑,对不熟悉这个领域的同学有些硬核,没关系,大家可以参考我解决问题的思路来处理自己的业务问题。

这个案例,是我如何使用GPT解决问题的全过程,从最开始定义问题到最终数据论证。

Part 1

背景信息

做电商的老板,一般都很关注自己品牌在行业内的市占率。市占率的数据获取,一般有2种途径。

01 官方平台

生意参谋、罗盘策略、京东商智等官方平台,会有行业竞争版块。

但平台方不希望品牌方拿到竞品的真实销售额,给的都是指数,没有办法看到实际的市占、竞品销售情况。

只能看到处理后的:交易指数、金额指数、流量指数等信息。

图片

图片

图片

(向右滑动以查看)

02 第三方平台

购买第三方平台的数据,如情报通、飞瓜。

第三方平台往往比较贵,比如情报通两个类目三个平台一年至少20w,且还是按周更新的。并且,第三方平台的稳定性和准确性,都不算太好。

所以说,能选官方当然选官方。之前生意参谋行业竞争数据,还可以用店透视、小旺神等插件进行转换,从而拿到真实数据。

图片

但最近,官方平台的指数算法升级,不同店铺的账号,看到同一个品牌的指数是不一样的,风控更严了。导致第三方插件逐渐无法使用。

图片

(点击查看大图)

但是,大盘销售额、本竞品市占率,又都是品牌方非常关注的指标,怎么办啊?

Part 2

探寻解法

遇事不决GPT,这事儿当然要找GPT,我就去找了它。

图片

GPT回答的第一点让我眼前一亮,困扰我们的问题的解法找到了!

通过找出历史数据中的销售额与相应时期的指数关系,建立数据模型,就可以测算出指数对应的大概销售额。

这题我会啊,不就是找y和x之间的函数关系,指数看成自变量x,实际成交金额看成因变量y。

只要能找出y与x之间的函数关系,我们可以去平台上获取指数x,通过函数关系计算出y的值,这题也就有解了。

此时的我,看到了希望······

然后,又陷入了绝望。这函数关系,咋找呢?我是数据产品经理,又不是算法工程师,要搞数据拟合,还要准确,这题咋解?

遇事不决GPT,我又把眼光投向了GPT,人我是PUA不了的,但GPT我可以无限PUA啊。

图片

唉,这个流程和数据分析很接近啊,数据分析我熟,这题大概能解了。

合并了一下思路,接下来要做三步:

1、数据收集与预处理

2、数据探查与模型建立

3、模型评估与验证

Part 3

实现过程

下面结合抖音-罗盘策略的品牌榜为例,来说说我的实现过程。生意参谋和京东商智也是一样的道理。

01 数据收集与预处理

之前明确过,测算的本质是:基于本品牌的历史数据,寻找指数与实际成交金额之间的函数关系,拟合出一个函数公式。

所以我们需要两部分数据:

1、本品牌的历史销售数据

2、行业竞争品牌榜的本品牌每日的指数值

把这两部分数据找出来之后,做个数据透视,留下需要的字段和数据。注意做好数据脱敏,最好把品牌相关信息去掉。

1、历史销售数据,保留以下字段:日期、品牌名称、销售额。

2、行业竞争品牌榜指数,筛选出自己品牌的指数数据,其他删掉,保留一下字段:日期、品牌名称、指数。

然后将这两部分数据,使用VLOOKUP函数合并到一张表格中。得到下图这样一张表,接下来就是寻找指数与销售额之间的函数关系了。

图片

可能有朋友在这一步就卡住了,Vlookup函数只能针对指定的一列做处理,没有办法处理两列啊。

没关系,遇事不决GPT,不妨我们把这个问题也丢给GPT看看。

你是一位excel处理专家。接下来需要问你一个excel问题,

我有两张数据表:

1)历史销售数据,字段有:日期、品牌名称、销售额。

2)行业竞争品牌榜指数,字段有:日期、品牌名称、指数。

我需要将第一张表的销售额拼到第二张表,根据日期和品牌名称拼,就是说,这两个字段一样时,拼过来。

我应该怎么操作?

图片

(向右滑动以查看)

再来看看更高阶的玩法,让GPT-4的代码解释器处理好给到我们。

在这里插入图片描述

(向右滑动以查看)

聊聊代码解释器

23年,GPT-4上线了代码解释器,它有一个很好用的地方是:允许模型自动生成代码,并且能够运行代码,当发现代码运行出错时,能自动修改代码继续运行。

这对于不会编程或者编程能力较弱的人来说是一个很大的福音,可以通过提示词来让GPT运行程序帮助自己处理一些问题。尤其是后来GPT又升级了一次,可以输入文件和导出文件。

这就意味着,我可以丢给GPT几个文件,然后让它处理,处理好之后把文件输出出来,整个过程相当丝滑。

就好比:我们提了一个数据处理的需求给Python工程师,工程师帮我们处理好了之后,然后又丢给我了。相当于有了一个可以无限PUA的Python工程师,让它干啥它就干啥,还从来不和你争论,一个月的工钱还不到200元。

代码解释器做数据处理有啥好处?

1、GPT-4做数据处理的原理是先自动编写Python脚本,通过Python做数据处理,所以不用担心它发生胡说

2、GPT-4可以上传多个文件,这样使得我们可以把数据文件上传给GPT-4,让它做处理

3、GPT-4可以输出文件,这样使得我们可以直接下载GPT-4处理好的文件

使用代码解释器的注意事项

1、代码解释器在封闭的环境下运行,且没有办法安装新的库(库在Python可以简单理解为一个个插件),也就是说如果没有这个库,可能Python是没有办法运行的。当然常用的一些库肯定是有的,比如数据分析、图表可视化、图像处理、机器学习等

2、注意数据脱敏,毕竟数据是需要上传给GPT的

3、提示词的写法,需要清晰、明确、具体

4、代码解释器目前的算力有限,且计算时间很小,如果数据量级过大目前还不太能处理。

使用Python做数据处理的注意点

1)一维数据、二维数据

一维数据:一般从各个平台下载下来的数据都是一维的,比如下图这种,字段(维度or指标)在一行,然后就是一条一条的数据

在这里插入图片描述

二维数据:一般是最终处理后的报表,比如下图,行与列均有对应的字段(维度or指标)
在这里插入图片描述

使用Python一般处理一维数据会比较好,二维数据,Python也能处理,但复杂度会高很多。所以,建议只给一维数据做处理。

2)数据处理类提示词写法注意点

数据类指令对清晰和明确要求会更高,所以在写此类指令要写清楚:有什么(输入),希望怎么处理(处理步骤),最后希望得到什么样的结果(输出)。

比如我这一段指令:

(角色设定)**你是一位Python处理专家,

输入)**接下来我会给你发两个文件:本品牌销售额、本品牌指数。

1)本品牌销售额字段有:日期、品牌名称、销售额

2)本品牌指数有:日期、品牌名称、指数

(处理过程)我希望你讲这两个文件合到一起,将本品牌销售额表中的销售额按照日期和品牌名称拼到本品牌指数表中

(输出)处理完之后,输出excel给我。

注释:

付费读书会产品的设计和销售

《视频号直播卖读书会 | 4小时进账2W+》@阿猫

付费减脂训练营的设计和实操

《0元投入变现4.5W,复购率超50%线上减脂营项目复盘》@小达

1、尽可能清晰明确,会发现我把字段全部列出来了,并告诉对方要怎么处理,“将本品牌销售额表中的销售额按照日期和品牌名称拼到本品牌指数表中”,这在数据逻辑中其实是左关联。

如果不明确,GPT也可以理解为另一种含义,“将本品牌指数表中的指数按照日期和品牌名称拼到本品牌销售表中。”

其实这是两种不同的含义,可能会导致结果出错。

2、如果处理步骤过多,最好描述清楚每一步的操作,减少大模型的思考,更容易得到自己需要的结果,比如下面这个提示词:

图片

总结 | 基于GPT-4的3种数据处理方式

图片

(点击查看大图)

大家可能到这一步,基本的数据处理能力就具备了,接下来会和大家分享稍微硬核点的内容,如何用GPT做算法调教。

这里涉及一些数据分析的逻辑,算法复杂不复杂都不重要,因为最后都是投喂给GPT去做的。

02 数据探查与算法建模

这部分是最重要的,需要我们通过GPT拟合出这两者之间的函数关系。

这部分需要对算法有一些基本的理解,先分享一些我理解的基本逻辑(我没有搞过算法,以下均是我个人在这次调教过程中总结的一些经验)

算法拟合基本的逻辑:数据预处理 >> 选择合适的算法模型 >> 调教模型,确定参数 >> 数据验证。

在这里插入图片描述

(点击查看大图)

关键点:

模型选择:模型有很多种,线性回归、多项式回归、决策树等等,需要根据我们当前面临的问题选择合适的模型,比如回归问题适合使用线性回归,分类问题适合决策树。

评估指标确定:一个判断什么样的模型是合格的标准,基于这个标准,我们可以选择到合适的模型。

这里带大家回忆一下高中数学学习过的线性回归,就是一个算法模型的处理过程。

数据探查:我们一般会先画散点图,观察趋势

模型选择:然后再使用线性回归方程求出参数

效果评估:计算R^2的值来评估模型拟合的好坏

图片

(向右滑动以查看)

本次可能用到的算法模型:

图片

(点击查看大图)

好了,我们回头来看看这次的案例。

数据探查 | 先让GPT预处理

我们可以先让GPT自己处理一下,看看GPT的效果:

图片

图片

(向右滑动以查看)

处理的时候会发现,GPT虽然拟合的效果不错,但与我们最终的目标还是差了点。

算法建模 | 反复调教GPT来修正结果

就像我们刚刚讲的,有两个关键点,我们来看看:

模型选择:不妨先从线性回归模型尝试,然后再尝试多项式回归(这里直接和大家说结论,指数测算需要使用分段函数,每一段内分别用一次项、二次项、三次项进行拟合)

评估指标:使用R^2和差值率(计算公式为:(测算金额-实际金额)/实际金额)。选择这两个指标的原因如下:

R^2,是统计学中用来评估模型的重要标准

差值率,是我们判断拟合效果的核心指标(最后会计算差值率作为监控的指标)

这里给大家贴一下我当时调教的记录:

图片

(向右滑动以查看)

按照这样的方式不断调教,每次让GPT给我们15种方案,直到我们能找到R^2>99% ,-5%< 差值率 < 5%的函数关系。

03 模型效果评估

测算完之后,需要验证这套公式是否可以使用。

验证方法如下:

验证标准:将实际成交金额与用指数计算出来的成交金额做差值比对。

1)通过GPT拟合出来的公式,计算成交金额

2)计算两个值,差值 = 计算成交金额 - 实际成交金额,差值率 = (计算成交金额 - 实际成交金额)/实际成交金额

图片

最后会得到类似于上图的数据,可以看出来误差很小,基本上就可以判断:指数测算成功。

Part 4

最后效果

用GPT测算的结果怎么样?

根据上面找到的拟合方法,我们先来看看最终实现的结果:

天猫 / 抖音 / 京东,均可以测算出指数与实际金额之间的关系,误差在5%以内,且数据量越大、数据质量越高,误差越小。

下图是三个平台能否测算的结论:

图片

** 注释:最新消息,生意参谋行业竞争版块在4月30日发生调整,行业大盘会下线,其余变成区间值。

然后和大家分享一下,目前实现的效果:

在一张电子表格中,每天监控天猫/京东/抖音,三大平台的指定类目下的行业销售额、本竞品市占率,每天上午可自动生成监控报表。

图片

总结 | 目前AI大模型在数据层面的应用

图片

如何学习AI大模型?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

在这里插入图片描述

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/331582.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

huggingface笔记: accelerate estimate-memory 命令

探索可用于某一机器的潜在模型时&#xff0c;了解模型的大小以及它是否适合当前显卡的内存是一个非常复杂的问题。为了缓解这个问题&#xff0c;Accelerate 提供了一个 命令行命令 accelerate estimate-memory。 accelerate estimate-memory {MODEL_NAME} --library_name {LIBR…

Ubuntu22.04虚拟机设置静态IP

虚拟机设置静态IP 按下电脑的 “win”键&#xff0c;在弹出的输入框中输入“控制面板”&#xff0c;选中控制面板 1.选择 “网络和Internet” 2.选择 “网络和共享中心” 3.选择 “更改适配器设置” 4.选择 “VMnet8”&#xff0c;双击打开 5.选择 “属性” 找到 “Internet …

Reactor设计模式

Reactor设计模式 Reactor模式称为反应器模式或应答者模式&#xff0c;是基于事件驱动的设计模式&#xff0c;拥有一个或多个并发输入源&#xff0c;有一个服务处理器和多个请求处理器&#xff0c;服务处理器会同步的将输入的请求事件以多路复用的方式分发给相应的请求处理器。…

Qt 界面上字体自适应控件大小 - 随控件缩放

Qt 界面上字体自适应控件大小 - 随控件缩放 引言一、设计思路二、进阶版大致思路三、参考链接 引言 Qt控件自适应字体大小可以用adjustSize()函数&#xff0c;但字体自适应控件大小并没有现成的函数可调. - 本文实现了按钮上的字体随按钮大小变化而变化 (如上图所示) - 其他控件…

10款免费黑科技软件,强烈推荐!

1.AI视频生成——巨日禄 网页版https://aitools.jurilu.com/ "巨日禄 "是一款功能强大的文本视频生成器&#xff0c;可以快速将文本内容转换成极具吸引力的视频。操作简单&#xff0c;用户只需输入文字&#xff0c;选择喜欢的样式和模板&#xff0c; “巨日禄”就会…

Python | Leetcode Python题解之第111题二叉树的最小深度

题目&#xff1a; 题解&#xff1a; class Solution:def minDepth(self, root: TreeNode) -> int:if not root:return 0que collections.deque([(root, 1)])while que:node, depth que.popleft()if not node.left and not node.right:return depthif node.left:que.appen…

Qt学习记录(14)线程

前言&#xff1a; 我的臀部已经翘到可以顶起一屁股债了 为什么要使用线程 什么时候用线程 复杂的数据处理 头文件.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QTimer>//定时器头文件QT_BEGIN_NAMESPACE namespace Ui { class Widget; }…

Hive安装教程

前置条件:hadoop&mysql docker容器安装mysql-CSDN博客 以下的/opt/bigdata目录根据自己实际情况更改 1.上传hive包并解压 tar -zxvf apache-hive-3.1.3-bin.tar.gz -C /opt/bigdata/ 2.修改路径 mv /opt/bigdata/apache-hive-3.1.3-bin/ hive cd /opt/bigdata/hive/…

CIC滤波器

CIC滤波器结构简单&#xff0c;没有乘法器&#xff0c;只有加法器、积分器和寄存器&#xff0c;适合工作在高抽样率条件下&#xff0c;而且CIC滤波器是一种基于零点相消的FIR滤波器。 CIC滤波器分为单级和多级滤波器。 1.在单极滤波器中&#xff1a; 当CIC滤波器的长度M远大于…

MongoDB(介绍,安装,操作,Springboot整合MonggoDB)

目录 MongoDB 1 MongoDB介绍 MongoDB简介 MongoDB的特点 MongoDB使用场景 小结 2 MongoDB安装 安装MongoDB 连接MongoDB MongoDB逻辑结构 MongoDB数据类型 小结 3 MongoDB操作 操作库和集合 操作文档-增删改 操作文档-查询 MongoDB索引 小结 4 SpringBoot整合…

【微积分】CH16 integrals and vector fields听课笔记

【托马斯微积分学习日记】13.1-线积分_哔哩哔哩_bilibili 概述 16.1line integrals of scalar functions [中英双语]可视化多元微积分 - 线积分介绍_哔哩哔哩_bilibili 16.2vector fields and line integrals&#xff1a; work circulation and flux 向量场差不多也是描述某种…

kubernetes的服务发现

目录 概述集群内部ip访问ServiceDNSHeadlessService 集群内 --> 集群外集群外--> 集群内NodePortHostPortIngress 概述 本篇介绍kubernetes的服务发现&#xff0c;主要分三部分&#xff1a;k8s 集群内部互相通信、k8s 集群内部访问外部、集群外部访问集群内部。   解决…

数理逻辑:1、预备知识

17.1 命题和联结词 ​ 命题&#xff1a;可以判定真假的陈述句。&#xff08;则悖论&#xff0c;祈使句&#xff0c;疑问句都不是命题&#xff09; ​ 原子命题&#xff1a;不能被分割为更小的命题的命题 例如&#xff1a; 2既是素数又是偶数 可以由$p: 2 是素数&#xff0c;…

与用户沟通获取需求的方法

1 访谈 访谈是最早开始使用的获取用户需求的技术&#xff0c;也是迄今为止仍然广泛使用的需求分析技术。 访谈有两种基本形式&#xff0c;分别是正式的和非正式的访谈。正式访谈时&#xff0c;系统分析员将提出一些事先准备好的具体问题&#xff0c;例如&#xff0…

Linux网络编程(socket)

1. 概念 局域网和广域网 局域网&#xff1a;局域网将一定区域内的各种计算机、外部设备和数据库连接起来形成计算机通信的私有网络。广域网&#xff1a;又称广域网、外网、公网。是连接不同地区局域网或城域网计算机通信的远程公共网络。 IP&#xff08;Internet Protocol&a…

三维场景感知之三维目标检测方向入门

三维目标检测入门 1 文档需知2 基础知识深度学习基础必上手项目科研研究必知道的论文门户深度学习必看论文 3 目标检测入门知识二维目标检测必看论文 4 三维目标检测入门知识三维目标检测必熟悉数据集三维目标检测点云分类分割预备知识三维目标检测必熟悉&#xff0c;必跑通&am…

自由职业香吗?

啥叫自由职业&#xff1f; 就是有随时随地做事的自由 有不打卡的自由 有不被PUA的自由 有不开低效会议的自由 有不写PPT八股文的自由 也有赚钱或者赚不到钱的自由 我从不来不劝人离职&#xff0c;除非这家公司关了。除了你已经跑通自己的业务闭环。 其实很多idea 都经过MVP。蘑…

ViLT学习

多模态里程碑式的文章&#xff0c;总结了四种多模态方法&#xff0c;根据文字和图像特征特征抽取方式不通。 文章的贡献主要是速度提高了&#xff0c;使用了数据增强&#xff0c;文本的mask 学习自b站朱老师的论文讲解

PLSQL连接Linux Oracle21c

PLSQL连接Linux Oracle21c 一、安装PLsql 下载官网 https://www.allroundautomations.com/registered-plsqldev/ 二、Oracle Instant Client下载 使用plsql连接oracle的时候是需要本地先安装oracle客户端&#xff0c;英文名就是Oracle Instant Client。 官方下载地址&…

Java | Leetcode Java题解之第100题相同的树

题目&#xff1a; 题解&#xff1a; class Solution {public boolean isSameTree(TreeNode p, TreeNode q) {if (p null && q null) {return true;} else if (p null || q null) {return false;}Queue<TreeNode> queue1 new LinkedList<TreeNode>();…