b站课程视频链接:https://www.bilibili.com/video/BV19x411X7C6?p=1
腾讯课堂(最新,但是要花钱,我花99元买了,感觉不错):https://ke.qq.com/course/3707827#term_id=103855009
本笔记前面的笔记参照b站视频,后面的笔记参考了付费视频
笔记顺序做了些调整【个人感觉逻辑顺畅】,并删掉一些不重要的内容,以及补充了个人理解
系列笔记目录【持续更新】:https://blog.csdn.net/weixin_42214698/category_11393896.html
1.R语言
R语言是S语言的一种实现。R是一个全面的统计研究平台,提供了各式各样的数据分析技术,拥有顶尖的绘图功能。
R中有大量的扩展功能,这些扩展功能称为R的包,目前R已经有5000个以上的扩展包
R的官网:https://www.r-project.org/,可以通过CRAN(R综合档案网络)下载R的扩展包。
2.数据分析的过程
数据采集->数据存储->数据分析->数据挖掘->数据可视化->进行决策
3.Rstudio的基本使用
设定工作目录:
getwd():显示当前工作目录
setwd(dir=“c:/……路径”): 设置工作目录
list.files():查看当前工作目录下的所有文件
.libPaths() 显示包的路径(前面有一点)
基本操作:
- tab键:语句提示,自动补齐。
- esc中断当前操作。
- x<-3 给x变量赋值3,R中也可以使用=赋值,但这样有时候会出问题。5->x这样的向右赋值也不推荐使用。
- x<<-5 表示强制赋值给一个全局变量,而不是局部变量。
- ls.str():查看当前工作空间中定义的变量的详细信息。
- str(x):列出变量x的详细信息。
- rm(x):删除对象(变量)。
- rm(list=ls()):删除所有对象(变量)。
- history():列出历史记录。
- history(25):列出最近的25条历史记录。
- ctrl+L:清空屏幕。
- save.image():保存工作空间,保存在当前工作目录下的.RData中,不过保存的工作空间只会保留数据和绘图函数等,绘制出来的图形不会单独保存。
- q():退出软件。
4.获取帮助
help(函数名)
或者 ?函数名
args(函数名):快速了解函数参数而不想查阅详细的文档。
example(函数名):查看函数使用的案例。
demo(graphics):列出R的一些案例图。
help(package=包名):查看R安装的某个加载的包的文档。
??包名:查看R安装的某个未加载的包的文档。
apropos(“关键字”):列出所有包含关键字的内容。 如apropos(“A”),就是列出“xxxAxxx” 的内容
apropos(“关键字”,mod=“function”):列出所有包含关键字的函数。
5. 内置数据集
R中的内置数据集存储在datasets这个包中,这些数据一般搜集于真实的调查数据。
help(package=“datasets”):查看数据集包。
data():列出所有数据集。
data(package = .packages(all.available = TRUE)):列出可用数据集
直接输入数据集名字,就可以使用该数据集。
这些内置数据集的名字都是默认的,我们在创建变量的时候最好不要与内置数据集的名字重叠。