本次分析的数据集来源为链家2017年房源信息。
在数据分析的过程中,我们也可以先去理解数据,再提出问题,在探索数据的过程当中,我们往往会发现很多有趣的事情~
1.提出问题
北京二手房的房价跟哪些因素有关呢?
2.读取数据,理解数据
导入数据分析相关工具包
%matplotlib 为魔法函数,之后的数据可视化过程中,有了它我们就不需要每次都使用plt.show()来显示图表了。
用pandas中的read_csv()方法读取格式为CSV的数据集,并用Head()方法默认查看前5行。
数据类型分析:
1.数值型:Floor,Price,Size,Year
2.字符串类型:Direction,District,Layout,Region,Renovation,Elevato
查看数据类型以及是否存在缺失值