众所周知,Python是一款非常优秀的编程语言,具有简单易学、多种应用场景、开源免费等优势,它在数据科学、人工智能、网络开发等领域得到广泛应用,成为了目前最受欢迎和流行的编程语言之一。
以前在数据分析课上,经常有做HR数据分析的朋友问我,是否有必要学习Python。我一直的观点是:没必要。因为Excel可以解决日常工作中的大部分数据分析问题。实在解决不了的,你可以找专业的数据分析师,没必要自己再去学习编程。
Python虽然很强大,但是学起来麻烦,如果你不是需要成天写代码的码农,学了编程后大概率会很快忘掉,很多人最后都有一种“从入门到放弃”的深刻体验。
但是,在使用了像ChatGPT这样的AI工具一段时间之后,我觉得非常有必要重新思考上面这个问题了。做数据分析的同学,不但有必要学习,而且非常有,因为这会加倍的提升你的工作效率。
为什么这么说呢?一般人学习编程最大的障碍是学完代码容易忘掉。现在有了AI这个助手,你并不需要记住详细代码。用自然语言直接把需求告诉AI,剩下的代码AI会自动帮你写完。
不过,你暂时还不能100%的无脑依靠AI提供的代码。这也是为什么你依然需要懂一点编程的基础,因为AI提供的代码可能需要你做个别地方的手动调整。
简单来说,Python在数据分析上比Excel有以下优势:
1 数据读取
Excel虽然有友好的用户界面和易于学习的特点,但是面对大数据量时处理能力有限。理论上,当数据量100万行或1.6万列时,Excel会变得缓慢和不稳定。
大家平时应该也能感受到,当数据量超过1万行时,Excel的效率会明显降低,系统甚至容易死机。因此,对于需要处理大数据量的任务,Excel并不是最优选择。相反,Python非常适合大数据量的处理,上万行的数据处理起来基本上就是瞬间的事情。
举个例子,我们公司从电商网站上每天下载的销售数据量都是上万行,数据存储在Excel或CSV格式文件中。如果要把多个这样的文件整合为一个文件,用Excel进行数据读写,可能需要手动打开每个文件,然后复制和粘贴数据到同一个工作表中,耗时耗力。
但如果使用Python完成以上任务,只需要写一行代码(几秒钟)即可完成。记住,如果你有了GPT这个助手,你并不需要去记住这行代码,随时把你的需求抛给GPT就好了。当代码生成之后,你只需要按照实际情况修改下代码中的文件名和路径即可:
代码运行之后,你的整合数据后的新文件就立刻出现在了你所指定的文件路径下。
2 数据清理
Excel可以进行基本的数据清理操作,例如删除重复数据、筛选和排序数据、提取和拆分文本数据等。但在面对复杂的数据清理和转换任务时,Excel的功能会变得有限。而Python提供了丰富的数据清理和转换库,可以进行更加复杂的数据清理和转换操作,例如数据的分组和重塑等。
举个例子,你手上有一张上万行数据的表格,表格中一些数据缺失和数据重复,你希望把这些缺失数据以及重复数据所在行全部删除掉。如果用Excel处理,你需要逐列进行手动筛选,然后再删除空值和重复值。考虑到Excel处理大数据的缓慢,整个工作的效率可想而知。
但是,以上任务如果你用Python来完成,也就是一两行代码和几秒钟的事情,甚至都不需要你直接打开原始数据表,以上任务就已经自动完成了。具体代码如下图所示:
3 数据转换
我们有时候需要把表格中的数据进行转换,比如把量化数据转化为非量化数据。在Excel中的做法是先筛选,再手动修改。同样,如果数据量巨大,则耗费的时间和精力都会不少。
举个例子,我有下面这张数据表格,我需要把租金按大小进行分类:
其中租金小于1000为“便宜”,租金在1000到1200之间为“适中”,租金大于1200为“昂贵”。用Python代码来实现这个转换,只需两三段代码即可自动解决:
同样,上面截图的代码虽然看上去较多,但是用户无需任何记忆,只需要把要求抛给AI,剩下工作它自动帮你完成。
4 数据建模
Excel可以进行基本的数据建模和分析操作,比如可以做简单的线性回归数据建模,但是Excel对于高级的数据建模和分析任务的支持有限。
相反,Python提供了强大的数据建模和分析库,可以进行复杂和高级的数据建模和分析任务,例如机器学习建模。
举个例子,假设你是一家电商企业的销售负责人,你想了解客户的消费行为和购买习惯,并根据这些信息对客户进行市场分类,以便有针对性地定位企业的市场营销策略。
在收集完好大量客户的购买信息之后,你需要用到机器学习中的一个算法:聚类分析,将这些客户划分为不同的群体,以便更好地了解他们的购买习惯和消费行为。
这样的高级分析任务,Excel是无能为力的,只能通过Python完成。
今天,机器学习已经被广泛应用于人力资源管理领域的高级数据分析。比如:在招聘决策中,根据候选人的各种特征使用决策树算法;在离职预测中,使用逻辑回归算法;在员工调研中,使用文本分类算法,等等。
以前,作为非数据分析专业人士,你会感觉学习写这些枯燥的代码是不可能的任务。但是今天有了GPT,你唯一需要做的就是熟悉这些算法和模型基础(仅仅基础而已),然后把你的要求具体描述出来,交给GPT,剩下的代码编写工作它会自动为你完成。
总结
Excel更适合用于简单的数据分析任务和小规模的数据集处理,如果你的数据量没有达到成千上万,并且只做基础的计算与统计,用Excel更适合。
Python更适合用于复杂的数据分析任务和大规模的数据集处理。尤其是,如果你想实现数据自动化,完成分类、预测等高级数据分析,用Python更适合。
自从有了GPT这个强大的AI工具之后,一切变得简单了。普通人不再需要学习全面的编程知识,只需要具备初级基础知识,即可在GPT的帮助下完成相关的复杂数据分析任务,实现工作质量和效率的飞跃。
关于Python技术储备
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
对于0基础小白入门:
如果你是零基础小白,想快速入门Python是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等习教程。带你从零基础系统性的学好Python!
零基础Python学习资源介绍
👉Python学习路线汇总👈
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
👉Python必备开发工具👈
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉Python学习视频600合集👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉100道Python练习题👈
检查学习结果。