科学计算库(Numpy)
通常数据都能转换成矩阵,行就是每一条样本数据,列就是每个字段的特征,Numpy在矩阵运算上非常高效,可以快速处理数据并进行数据计算。
Numpy基本操作
先导入
import numpy as np
array数组
ndarray是Numpy中的底层数据类型,是后续矩阵操作的基本对象。
如图可实现将数组各个元素值+1操作
数组相加,相乘操作
输出结果表示当前数组是一维的,其中有5个元素
array()中传入二维数组
使用ndarray数组时,需要注意数组中所有元素必须是同一类型,如果不是会自动向下进行转换(int→float→str)。
数组属性操作
常见的数据类型有整型、浮点型、字符串,机器学习中float更通用一些。
索引与切片
Numpy中,索引、切片用法与Python用法基本一致
[1:3]左开右闭,索引从0开始。
[-2:0]表示从倒数第二个开始取到最后。
矩阵格式(多维的形式)
赋值
数值索引
bool索引
数据类型与数值计算
在操作与计算数据之前一定弄清楚数据的类型,使用不同的工具包函数时最好先查阅其API文档,将数据处理成该函数所需要的格式,以免计算过程出现各种错误。
数据类型
复制与赋值
数组中 ===== 是引用操作,使地址相同
要想复制一个数组需要这样
数值运算
Numpy除了求和还有别的一些计算操作:
矩阵乘法
主要两种计算方式:
- 一种按对应位置元素进行相乘
- 另一种是在数组中进行矩阵乘法
矩阵乘法对应维度必须相同
使用函数功能时,要注意是否符合预期,在进行计算时,先用实例数据样本进行操作,确认无误再执行大规模操作。
常用功能模块
排序操作
数组形状操作
对数组操作时,为了满足格式和计算要求通常会改变其形状:
数组的拼接
两份数据组合,需要拼接操作: