我们爬了上千个数据分析师信息, 你真的懂数据分析师嘛?

01 项目简介

有人说,这个时代,只要站在了风口,猪都能飞起来,尤其互联网行业,千变万化,日异月殊,一不小心就错过了风口,如果没记错的话,前几年火的是App开发,后来是大数据,再接着是人工智能,现在则是区块链,有人甚至用币圈一日互联网十年来形容虚拟币和区块链的火爆,如果单从热点看,大数据貌似有点out了,那究竟如何呢?今天就对拉勾网上的数据分析职位的相关信息来一个探索性分析。


02 数据集

之所以采用拉勾网(201712)的数据,是由于在互联网垂直招聘领域,拉勾网坐第一把交椅,无论是职位数量还是职位有效性,都优于其它渠道。本次采用的数据集主要有以下变量:薪酬下限、薪酬上限、工作地点、经验要求、学历要求、工作时间、公司、所处行业、公司融资情况、投资机构、岗位要求等。


03 目的

通过实际数据来看看数据分析一职的现况如何,薪资是否还有吸引力等,具体来说,探索以下几个问题:

  1. 数据分析职位在各城市的需求对比;

  2. 数据分析师的待遇情况;

  3. 工作经验要求;

  4. 互联网热点城市的待遇情况;

  5. 工作经验对待遇的影响;

  6. 学历对待遇的影响;

  7. 需要掌握的技能;

  8. 哪些技能更吃香;

  9. 不同的经验要求是否意味着不同的技能要求。


04 分析工具

在Jupyter Notebook中以Python3及其pandas、matplotlib、seaborn 和 wordcloud包为主进行分析。下面开始正式分析。


数据整理

前期准备工作,由于matplotlib包使用的默认字体不支持中文,所以得修改配置,用文本编辑器打开下面命令得到的路径中的 matplotlibrc文件,将以 font.family和 font.sans-serif开头的两行前的注释符(#)删掉,并在“font.sans-serif:”后加上SimHei,更改后结果如 font.sans-serif : SimHei, msyh, DejaVu Sans, ......;再将附带的字体文件放入matplotlib同级目录下的\fonts\ttf目录中。

import matplotlibprint(matplotlib.matplotlib_fname())

接着删除下面命令得到的用户目录中.matplotlib下的所有带cache的文件及文件夹后重启 Jupyter Notebook。

print (matplotlib.get_configdir())

准备工作完成,下面正式读取数据并整理。

# python3
# _*_ coding:utf-8 _*_
# 导入所需的包
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from wordcloud import WordCloud
% matplotlib inline
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
# 读取数据
df = pd.read_excel('la_gou.xlsx')
# 删除不需要的变量
df_clean1 = df.drop(['Index''home_page''address''url''date_time'],axis=1)
# 删除冗余行
df_clean = df_clean1.drop_duplicates(['company''title''description'])
df_clean=df_clean.reset_index(drop=True)
df_clean.info()
640?wx_fmt=jpeg

经过处理后的数据有16个变量,1766个观测值,其中投资机构(investor)缺失值太多,不过它不是这次分析的重点,影响不大。

探索数据

一、职位在地域方面的区别:

city_series = df_clean['city'].value_counts()
y_cor = list(city_series.values)
x_cor = list(np.arange(len(y_cor)))

city_series.plot(kind='bar', figsize=(18,10), fontsize=15, rot=40);
for x,y in zip(x_cor,y_cor):
    plt.text(x, y+1'%s' % y, ha='center', va= 'bottom',fontsize=14);
plt.title(u'各城市职位数量', size = 18);
plt.show();

640?wx_fmt=jpeg

分析结果显示,与以往媒体报道的北京互联网发展遥遥领先不同,上海至少在数据分析职位方面的需求超过了北京,但也只是略超,同时,深圳与上海和北京相比,需求数量差距也不是非常大,其次杭州和广州的需求比较大,且两者几乎无差距,再者就是成都有一定需求,其它城市的需求非常少。总体来说与人们对互联网强城市的印象相符。

二、薪资概况:

# 由于招聘给出的薪资是一个区间,故采用其上限和下限间的中值进行分析
df_clean['salary_median'].hist(figsize=(10,6), bins=30, edgecolor='k', grid=False);
plt.xlabel(u'薪资(千/月)', size=15);
plt.ylabel(u'频数', size=15);
plt.title(u'薪资分布', size=18);
plt.xticks(range(0,90,5), size=15);
plt.yticks(size=15);
plt.grid(axis='y', alpha=0.2);

640?wx_fmt=jpeg

从分布看,薪资差异较大,有大量五千到两万五之间的职位,超过三万的寥寥无几,最高有达到七万多的,与人们印象不同,并不是每个数据分析师都能"月薪过万",低于一万的也有一定比例,但最多的还是一万五到一万七的,总的来说,待遇非常吸引人。

三、工作经验要求:

640?wx_fmt=jpeg


# 应届毕业生和10年以上人数很少,将应届毕业生归类到一年以下,将10年以上归类到5-10年,并去掉空格
for i in df_clean.index:
    df_clean.loc[i,'experience'] = df_clean.loc[i,'experience'].strip()
    if df_clean.loc[i,'experience'] == u'应届毕业生':
        df_clean.loc[i,'experience'] = u'1年以下'
    if df_clean.loc[i,'experience'] == u'10年以上':
        df_clean.loc[i,'experience'] = u'5-10年'

experience_freq = df_clean['experience'].value_counts()


640?wx_fmt=jpeg experience_sort = pd.Series([38621732141234], index=[u'1年以下',u'1-3年',u'3-5年',u'5-10年',u'不限'])
experience_sort.plot(kind='bar',figsize=(8,5), fontsize=15, rot=0);
plt.grid(color='#95a5a6', linewidth=1,axis='y',alpha=0.2)
plt.xticks(range(5), experience_sort.index, size=15)
plt.ylabel(u'频数', size=15);


640?wx_fmt=jpeg

绝大部分岗位都要求有工作经验,3-5年的最多,其次是1-3年的,5-10年的专家级也有一定需求,还有一些不限经验的,可能是忘记填写或实习之类的。

四、互联网热点城市薪资概况:

salary_groupby_city = df_clean.groupby('city')['salary_median']
large_city = city_series[0:6].index
salary_of_city = []
for city in large_city:
    salary_value = salary_groupby_city.get_group(city).values #得到各城市对应的薪水的数组
    salary_of_city.append(salary_value)

plt.style.use('seaborn-darkgrid')
matplotlib.rcParams['font.sans-serif'] = ['SimHei']# 对于有些seaborn的style,必须同时运行此命令,否则还是不显示中文
plt.figure(figsize=(10,5));
plt.boxplot(salary_of_city, boxprops = {'color':'blue'},
            flierprops = {'markerfacecolor':'red','color':'black','markersize':4});
plt.title(u'互联网热点城市薪资分布', size=18);
plt.ylabel(u'薪资(千/月)',size=15);
plt.xticks(np.arange(6)+1,large_city, size=15);
plt.yticks(size=15);
plt.grid(color='#95a5a6', linewidth=1,axis='x',alpha=0.2);

640?wx_fmt=jpeg

从结果看,北京的月薪中位数最高,在2万元,其次是上海,在1.75万左右,深杭在1.5万左右,广州成都只有1万,但薪资最高的职位在深圳。

五、工作经验对薪资的影响:

salary_groupby_experience = df_clean.groupby('experience')['salary_median']

salary_of_experience = []
for experience in experience_sort.index:
    salary_value = salary_groupby_experience.get_group(experience).values
    salary_of_experience.append(salary_value)

plt.figure(figsize=(10,5));
plt.boxplot(salary_of_experience, boxprops = {'color':'blue'},
            flierprops = {'markerfacecolor':'red','color':'black','markersize':4});
plt.title(u'不同工作经验的薪资待遇', size=18);
plt.ylabel(u'薪资(千/月)',size=15);
plt.xticks(np.arange(5)+1,experience_sort.index, size=15);
plt.yticks(size=15);
plt.style.use('seaborn-darkgrid');
matplotlib.rcParams['font.sans-serif'] = ['SimHei'];
plt.grid(color='#95a5a6', linewidth=1,axis='x',alpha=0.2);
640?wx_fmt=jpeg

可见经验越久,待遇越高,有5年经验的薪资中位数最低也有2万,远比传统行业高。

六、学历对薪资的影响:

640?wx_fmt=jpeg edu_sort = pd.Series([52,170,1465,78,1], index=[u'不限',u'大专',u'本科',u'硕士',u'博士'])
salary_groupby_edu = df_clean.groupby('education')['salary_median']
salary_of_edu = []
for education in edu_sort.index:
    salary_value = salary_groupby_edu.get_group(education).values
    salary_of_edu.append(salary_value)

plt.figure(figsize=(10,6));
plt.boxplot(salary_of_edu, boxprops = {'color':'blue'});
plt.title(u'不同学历的薪资待遇', size=18);
plt.ylabel(u'薪资(千/月)',size=15);
plt.xticks(np.arange(5)+1,edu_sort.index, size=15);
plt.yticks(size=15);


640?wx_fmt=jpeg


其中不限学历的可能由于招聘者忘记选择,也可能由于其是新兴领域,更看重实际能力而非学历,对于有明确要求的,大专明显低于本科和硕士,本科和硕士的差距倒不是特别大,只是硕士的起薪要高。

七、工作技能要求:

# 添加技能列
import re
def get_skill(text):
    skill_list = re.findall('([a-zA-Z][0-9a-zA-Z]+|C\#|\.Net|R\d?|A\/B|算法)', text)
    for skill in skill_list:
        if skill.upper() == 'EXCEL' or skill.upper() == 'PPT':
            skill_list[skill_list.index(skill)] = 'office'
    return ','.join(skill_list).upper()
df_clean['skill'] = df_clean['description'].apply(get_skill)

# 生成技能字典
import nltk
skill_list = []
for i in df_clean.index:
    if len(df_clean.loc[i, 'skill']) > 0:
        skill_list.extend(df_clean.loc[i, 'skill'].split(','))

skill_freq = dict(nltk.FreqDist(skill_list))

# 删除主要的提取错的键值
del skill_freq['AND']
del skill_freq['TO']
del skill_freq['IN']
del skill_freq['DATA']
del skill_freq['THE']
del skill_freq['OF']
del skill_freq['KPI']
del skill_freq['APP']
del skill_freq['WITH']
del skill_freq['SERVER']

wc = WordCloud(width=800, height=400, background_color='white').generate_from_frequencies(skill_freq)
plt.figure(figsize=(8,4));
plt.imshow(wc);
plt.axis('off');
plt.show();
640?wx_fmt=jpeg

可见,SQL,Office(主要是Excel和PPT)是需求最大的,是绝大多数要求必须掌握的;其次,Python,算法和R的需求也很大,另外SAS,SPSS,Hadoop,Hive的需求也不小。

八、查看主流技能的薪酬平均中值:

# 选取需求最多的20个技能
skill_sort = sorted(skill_freq.items(), key=lambda item:item[1], reverse=True#对技能频数字典按值从大到小排序
hot_skill_list = skill_sort[0:20]

hot_skill_salary_mean = {} # 存放技能中值的均值的字典
for i in hot_skill_list: # i 为技能和其频次的列表的元素
    for j in df_clean.index:
        if i[0in df_clean.loc[j, 'skill']: # 如果技能在数据框的技能列中
            if i[0in hot_skill_salary_mean: # 如果技能在技能中值的均值的字典中
                # 技能键的值为原值加上新值
                hot_skill_salary_mean[i[0]] = hot_skill_salary_mean[i[0]] + df_clean.loc[j, 'salary_median']
            else:
                hot_skill_salary_mean[i[0]] = df_clean.loc[j, 'salary_median']
    hot_skill_salary_mean[i[0]] = hot_skill_salary_mean[i[0]] / i[1# 技能中值的均值为之前计算的和除以技能频数

hot_skill_salary_mean = sorted(hot_skill_salary_mean.items(), key=lambda item:item[1]) #排序
hot_skill_salary_mean #排序后返回由含字典元素的元组构成的列表

hot_skill_freq = [] #把前20个技能的需求频数提取出来
for i in hot_skill_salary_mean:
    hot_skill_freq.append(skill_freq[i[0]])
hot_skill_freq # 排序会按其薪酬均值从小到大

hot_skill_salary_key = [] # 热门技能名称列表
hot_skill_salary_values = [] #热门技能的中值的均值列表
for i,j in dict(hot_skill_salary_mean).items():
    hot_skill_salary_key.append(i)
    hot_skill_salary_values.append(j)

plt.figure(figsize=(10,6));
plt.scatter(x = np.arange(len(hot_skill_salary_values)), y=hot_skill_salary_values, s=hot_skill_freq);
plt.xticks(np.arange(len(hot_skill_salary_values)), hot_skill_salary_key, size=15, rotation=40);
plt.yticks(size=15);
plt.title('不同技能可以拿到的薪资中位数的均值', size=18);
plt.ylabel('千/月', size=15);
plt.ylim((5,26));

640?wx_fmt=jpeg

泡泡大小代表了需求量,从结果看,会R的薪资最高,但这只是高薪的必要条件,而非充分条件,另外算法太低,可能是由于大多数岗位需求里都提到了算法,进而拉低了其均值,如果进一步分析,应该能得出比较贴合实际的数据,或者也可直接将此项剔除,分析其它岗位如深度学习机器学习的薪资来得到算法的薪资均值。Java是走向高级开发必不可少的路,Hadoop,Spark,Hive仍然是数据分析类职位的高薪必备技能。

九、看看主要工作经验对主流技能的要求是否有差别:

# 生成字典,来存放两种经验对应的主流技能需求数
skill_by_exp13 = {}
skill_by_exp35 = {}
df_skill_13 = df_clean[df_clean['experience']=='1-3年'][['experience''skill']]
df_skill_35 = df_clean[df_clean['experience']=='3-5年'][['experience''skill']]
for i in hot_skill_salary_key:
    for j in df_skill_13.index:
        if i in df_skill_13.loc[j, 'skill']:
            if i in skill_by_exp13:
                skill_by_exp13[i] = skill_by_exp13[i] + 1
            else:
                skill_by_exp13[i] = 1

for i in hot_skill_salary_key:
    for j in df_skill_35.index:
        if i in df_skill_35.loc[j, 'skill']:
            if i in skill_by_exp35:
                skill_by_exp35[i] = skill_by_exp35[i] + 1
            else:
                skill_by_exp35[i] = 1

ind = np.arange(len(skill_by_exp13))
width = 0.35
sns.set(context='notebook', style='darkgrid', palette='muted', font='simhei')
plt.figure(figsize=(12,6));
plt.grid(color='white', linewidth=1,alpha=0.3);
plt.bar(ind, pd.Series(skill_by_exp13).values, width,  label='1-3年');
plt.bar(ind + width, pd.Series(skill_by_exp35).values, width,  label='3-5年');
plt.title('不同工作经验对主流技能的需求对比', size=18);
plt.xticks(ind+width/2, pd.Series(skill_by_exp13).index, size=15, rotation=40);
plt.yticks(size=15)
plt.legend();


640?wx_fmt=jpeg

几乎所有主流技能,3-5年工作经验的需求量都比1-3年的多,但这很大可能是因为3-5年的招聘数本身就比1-3年的多100个左右,但我注意到,对Matlab、MySQL、VBA及Tableau的需求两者相差无几,VBA方面3-5年的甚至低于1-3年的,这说明3-5年经验要求的对这四种技能的需求不如1-3年的多。

05 结论汇总


  1. 对数据分析一职的需求主要集中在北上广深杭,其中北京和上海遥遥领先,深圳需求紧随其后,广州和杭州相比上海和北京需求减半,但比起其它城市依然不少。

  2. 大多数职位提供的薪资中值在5千到2万5之间,很少有给出3万的,但也有极少数岗位,给出了五六万的高薪。

  3. 大多数岗位要求有工作经验,要求有3-5年经验的最多,其次是1-3年的,不要求或只要求不到一年的很少。

  4. 互联网发展热门城市中,北京给出的薪资的中值最高,达到了2万元,上海紧随其后,比北京低一两千,杭州和深圳基本持平,基本在1万5左右,这有点出人意料,考虑到置业成本,去杭州貌似比深圳更好,广州和成都的中值在1万左右,可见,至少在数据方面,杭州的发展已经超过广州这个一线城市了。

  5. 工作经验与薪资密切相关,1-3年经验的薪资中值大部分超过了1万,3-5年的都在1万5以上,而5年以上的,薪资中值都在2万以上。

  6. 学历方面,硕士对本科的优势不是很明显,但下限是肯定高于本科的,大专相比本科劣势就比较明显了,薪资低不少,而博士相对硕士也有很大优势,但需求少。

  7. 技能方面,office(主要是excel其次少部分PPT)和SQL需求最多,Python、R、算法紧随其后,Hadoop、SPSS、Hive、SAS、和Spark的需求也不少。

  8. 对于拿到高薪的必要条件,R优势最大,其次是Java,Linux等,当然这些条件并非单一满足,一般要同时会其它高级技能才能拿到高薪,显然这已经不是基础的数据分析需要的技能了,可能侧重于数据挖掘和建模等。

  9. 要求3-5年经验的和要求1-3年经验的在技能需求上没有太大差别,对于这条结论不是很有把握,不是太符合逻辑,等日后再详细分析。


06 思考·总结


通过这次分析,深切的感受到了思路的重要性,如果你对探索数据没有好奇心,没有一点自己的想法,那真可谓无处下手,不知道该分析什么,正所谓思路为“道”,工具为“术”,分析之前,得先给自己提出几个想探索的问题,或想验证的假设,当然这点不是非得一步到位,也可以循序渐进,随着分析的不断进行再开展新的探索。

“术”方面的工具技能也很重要,有时候你不知道那个函数的用法,不知道那个参数的设置,可能找很久都找不到,比如对柱状图添加文字说明,起初我按照搜索到的方法添加,可就是不出效果,搜了好几种方法都不行,无奈之下我只得把别人的代码截图一行一行敲下来运行验证,最后发现是因为没放在一个cell里这个低级原因,当然,这个过程中我又学到了别的知识。

术方面还有一点需要说的是,早期seaborn包会对matplotlib的图自动美化,但新版改了,不会自动美化,得自己设置,这方面花了大量时间搜索,主要是不知道对应的术语叫什么,只能按文字描述搜索,最后发现,图像的灰底不是颜色,是style,可以用两种方式设置,但两种都不好用,因为只要对一个图设置后,那做其它图时都会默认采用你设置的这个style,而我希望只针对单个图起作用。

项目之外的,我感到主动学习非常重要,对于自己不会的,不要畏惧,也不要偷懒,要相信自己碰到的问题别人也绝对碰到过,搜一搜,看看别人是怎么解决的,比如对于技能的提取及词云的绘制,起初用了结巴分词提取,但提取有疏漏,不过没有大的问题,但绘制词云时,出来的都是中文词,基本没有技能名,我只好去找别的方法,看能不能过滤掉结巴提取后的中文词,最后发现何不采用正则重新提取呢,于是进行了重新提取,但绘制词云时又碰到重复显示的问题,同样的词以不同大小和颜色显示好几次,但词并没有问题。最后用自定义词典解决了。

另外就是英语非常重要,有些函数的参数太多,以至于官网文档都没有详细说,它可能是作为一些共用的参数放在了其它函数中介绍。最后,对于岗位描述的探索还能进一步采用语义分析,得出更明确的要求,因为有些要求是必须满足的,有些是加分项,但水平所限,还不能语义分析,还有就是投资公司,如果数据较全也能探索下金融方面这些机构的投资偏好及相互间的裙带关系,毕竟,中国的互联网,谁都绕不开阿里腾讯及其背后的资本。

作者:iRunning

来源:知乎

链接:https://zhuanlan.zhihu.com/p/3563353

∞∞∞


IT派有个广州交流群,了解一下?

如果你在广州地区,今天内加IT派小助手并回复“广州”二字,即可拉你进“广州朋友圈”和大家一起交流学习。

注:其他时间段回复关键词恕无法拉你进到你想进的群中,笔心~ 


小助手加好友二维码在这里

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62423.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何快速成为数据分析师

没有什么牛逼的事情是能够速成的,越是底层的、收益周期越长的技能越是这样。 但这并不代表,我们不能用一些有意思的方法,把学习的过程变得高效而有趣。 学习一门技术之前,你应该知道,你想要达成的目标是什么样的&…

数据分析案例-数据分析师岗位招聘信息可视化

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

数据分析师岗位 分析可视化

目录 前言 一、导入模块 二、数据处理与分析 1.读取数据 2.查看数据表格描述 3.处理重复值 4.处理缺失值 5.提取地区信息 6.提取经验信息 7.提取薪资信息 三、Pyecharts数据可视化 1.每个地区的招聘数量 2.平均工资最高的地区 3.经验学历需求图 4.招聘公司所在…

文心千帆与文心一言API的使用

我在今年三月份左右申请了百度文心一言的测试,不久就通过了申请,体验了一段时间,感觉很棒,但是我更希望百度能早一点开放文心一言的API,不用在线去使用。 在7月19日那天,百度智能云给我打电话,问…

噫吁嚱!文言文亦能编程!此诚年度最骚语言也

栗子 晓查 发自 海边边 量子位 报道 | 公众号 QbitAI 同学,你可知如何用文言文输出“Hello World”? 请君睁圆双眼注视于此: △ 右边一顿输出 吾有一言。曰「「問天地好在。」」。書之。 却为何输出了三遍? 只因有for循环&#x…

60句高逼格的文言文,不收藏绝对是你的损失!

还记得前段时间火极一时的 “看到……应该想到” 系列吗? 由此可见国学早已渗透到生活的方方面面,关键时候还能映衬出你的儒(liao)雅(mei)高(zhuang)深(bi)。…

妙哉!那个用文言文编程的小哥,竟从28万行唐诗中找出了对称矩阵

梦晨 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你能看出来,这首诗妙在哪里吗? 其实,横着读是一首诗,竖着读还是这首诗! 而且,这首诗可不是乱编的,其中的诗句都来自《全唐诗》,…

文心一言 VS 讯飞星火 VS chatgpt (64)-- 算法导论6.5 3题

文心一言 VS 讯飞星火 VS chatgpt (64)-- 算法导论6.5 3题 三、要求用最小堆实现最小优先队列,请写出 HEAP-MINIMUM、HEAP-EXTRACT-MIN、HEAP DECREASE-KEY 和 MIN-HEAP-INSERT 的伪代码。 文心一言: 以下是使用最小堆实现最小…

chatgpt赋能Python-mac系统的python

在Mac系统上运行Python:一个简介 介绍 Python是一种流行的、易于学习的编程语言,被广泛用于各种用途,从数据分析到机器学习。如果您是Mac用户,那么您已经安装了Python,因为它是系统的一部分。本文将介绍如何在Mac系统…

微软 Copilot “杀疯了”,太刺激了...

1 刺激 这段时间真是太刺激了。 就在最近,微软宣布了 Copilots for Windows 11 以及其他一系列产品。作为AI助手,Windows Copilot将直接集成到Windows 11中,在所有应用和程序中都可使用,就像我们在Edge、Office程序和GitHub中看到…

GPT-4来了,计算机视觉科研,何去何从?

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【计算机视觉】微信技术交流群 作者:Mike Shou |(已授权转载)编辑:CVer https://zhuanlan.zhihu.com/p/616966879 最近上课被…

【chatGpt】关于websocket连接中对未授权的捕捉问题

目录 问题 有效提问 有效的细节提问 问题 一路上,通过简单的error进行判断弹出授权,会有很多乱弹的现象: (1)链路正常切换会断 (2)服务器没有启动会连接不上 (3)没…

Vscode 用MarkDown画流程图

效果图 start>start: 开始 input>inputoutput: 输入 operation>operation: 操作 condition>condition: 操作出错? output>inputoutput: 输出 error>operation: 请重新输入 end>end: 结束start->input input->operation operation->co…

chatgpt赋能python:Python画图设置背景颜色

Python画图设置背景颜色 在Python中使用Matplotlib和Seaborn等库来生成数据可视化图表非常方便。但是,这些图表默认使用白色背景。有时,我们需要在制作图表时更改背景颜色以匹配我们的主题或品牌标识。本文将介绍如何在Matplotlib和Seaborn中设置不同的…

chatgpt赋能Python-python3如何画图

Python3如何画图? Python是一种高级编程语言,它有着多种用途,包括数据分析和可视化。Python3是Python的最新版本,它具有更好的性能和易用性。在这篇文章中,我们将介绍如何使用Python3来画图,并探讨其优势和…

chatgpt赋能python:Python画图坐标轴大小

Python画图坐标轴大小 Python是一种广泛使用的编程语言,它在科学计算和可视化方面得到了广泛的应用。在可视化中,坐标轴的大小和比例对于展现数据的真实性和清晰性至关重要。在本文中,我们将介绍如何使用Python画图坐标轴大小,并…

“烧钱”的大模型:初探成本拆解与推理优化方法

编者按:大模型的成本问题一直以来是大家重点关注的问题,本文重点讨论了训练大型语言模型(LLMs)需要的成本,并简要介绍什么是LLM以及一些用于优化大模型推理表现的技术。 虽然很难准确预测LLMs未来会怎么发展&#xff0…

Spring Cloud 优惠最后 1 天!

大家好,我是栈长。 关注了一段时间公众号的小伙伴都知道,栈长的 Spring Cloud 微服务课程每月都会给小伙伴搞一波活动。 61活动来了,很多小伙伴都在等 61 的活动,这次活动,福利全新升级,千万不要错过&#…

微信公众号文章是否违规怎么检测?

在写文章的时候,会遇到以下3种情况: 1、你所编辑的图文消息可能含有敏感内容,你可以继续保存或发布该图文消息(发布等待时长约3-4小时),若保存或发布后,经核实含有敏感内容的,将可能…

如何发现并分析APP个人信息收集是否违规?

移动互联网的发展以及智能终端的兴起,手机已然成为了我们生活中不可或缺的“日用品”,各种手机APP开启霸屏模式,例如常见的支付APP、聊天APP、金融APP、交通APP等,这些APP虽然给我们生活带来了便利,但是其收集的用户信…