1.1 认识Numpy数组对象
1.1.1 导入NumPy工具包
#导包并起别名为np
import numpy as np
1.1.2 创建一个三行五列的数组
data = np.arange(15).reshap(3, 5)
打印结果:
1.1.3 查询data类型
print(type(data))
打印结果:
<class 'numpy.ndarray'>
ndarray是一个N维数组类型的对象
1.1.4 查询数组维度的个数
print(data.ndim)
输出结果:
2
1.1.5 查询数组的形状
print(data.shape)
输出结果
(3, 5)
1.1.6 查询数组元素的个数
print(data.size)
输出结果
15
1.1.7 查询数组中元素的类型
print(data.dtype)
输出结果
int32
1.2 创建Numpy数组
1.2.1 创建一个一维数组并赋值
import numpy as np
data1 = np.array([1, 2, 3])
print(data1)
输出结果
[1 2 3]
1.2.2 创建一个二维数组并赋值
data2 = np.array([[1, 5, 1], [2, 4, 7]])
打印结果
[[1 5 1][2 4 7]]
1.2.3 创建一个全零数组
#默认为浮点型
data3 = np.zeros((3, 4))
#改为整型
data3 = np.zeros((3, 4), int)
输出结果
//默认
[[0. 0. 0. 0.]
[0. 0. 0. 0.]
[0. 0. 0. 0.]]
//整型
[[0 0 0 0]
[0 0 0 0]
[0 0 0 0]]
1.2.4 创建一个全1数组
data4 = np.ones((3, 4))
输出结果
[[1. 1. 1. 1.][1. 1. 1. 1.][1. 1. 1. 1.]]
1.2.5 创建一个全空数组
#其实是趋于0的数
data5 = np.empty((3, 4))
输出结果
[[1.06810268e-306 1.42419938e-306]
[7.56603881e-307 7.56600486e-307]
[1.02360867e-306 1.29061889e-306]
[6.23040373e-307 1.42419530e-306]
[1.60219035e-306 3.11529184e-307]]
1.2.6 以等差数列创建一个数组
#从1开始到20为止,步长为5
data6 = np.arange(1, 20, 5)
输出结果
[ 1 6 11 16]
1.2.7 创建一个浮点类型的数组
data7 = np.array([1, 2, 3, 0.1], float)
输出结果
[1. 2. 3. 0.1]
其他的也可以指定类型,比如:
data8 = np.ones((2, 3), dtype='float64')
#也可以这样写
#data8 = np.ones((2, 3), float)
输出结果
[[1. 1. 1.][1. 1. 1.]]
1.3 ndarry对象的数据类型
1.3.1 查看数据类型
data1 = np.array([[1, 2, 3], [4, 5, 6]])
print(data1.dtype.name)
输出结果
int32
1.3.2 转换数据类型
data2 = data1.astype(np.float64)
print(data2.dtype)data3 = np.array([1.2, 1.3, 1.4, 3.3])
data4 = data3.astype(np.int64)
print(data4.dtype)data5 = np.array(["1", "2", "3", '4'])
data6 = data5.astype(np.int64)
print(data6)
print(data6.dtype)
输出结果
float64
int64
[1 2 3 4]
int64
1.4 数组运算
1.4.1 向量化运算
import numpy as npdata1 = np.array([[1, 2, 3], [4, 5, 6]])
data2 = np.array([[-1, -4, 1], [7, 5, 2]])
#将第一个数组中的元素与第二个数组中对应的元素进行加减乘除
print(data1 + data2)
print(data1 - data2)
print(data1 * data2)
print(data1 / data2)
输出结果
[[ 0 -2 4][11 10 8]][[ 2 6 2][-3 0 4]][[-1 -8 3][28 25 12]][[-1. -0.5 3. ][ 0.57142857 1. 3. ]]
1.4.2 数组广播
数组间的基础运算是一对一,但是当两者不一样时。就会自动触发广播机制,
但有些无法扩展的会报错,比如:(行数,列数), (3, 2) + (1, 3)报错
data3 = np.array([[1], [2], [3], [4]])
data4 = np.array([1, 2, 3])
print(data3 + data4)
输出结果
//相当于
1 1 1 1 2 3
2 2 2 + 1 2 3
3 3 3 1 2 3
4 4 4 1 2 3[[2 3 4][3 4 5][4 5 6][5 6 7]]
1.4.3 数组与标量间的运算
将数组中每个元素与标量计算,返回计算后的数组
data8 = np.array([[2, 8, 4], [3, 5, 7], [2, 4, 9]])
x = 7
print(data8 + x)
print(x - data8)
print(data8 * x)
print(x / data8)
输出结果
[[ 9 15 11][10 12 14][ 9 11 16]]
[[ 5 -1 3][ 4 2 0][ 5 3 -2]]
[[14 56 28][21 35 49][14 28 63]]
[[3.5 0.875 1.75 ][2.33333333 1.4 1. ][3.5 1.75 0.77777778]]
1.5 ndarray的索引和切片
1.5.1 整数索引和切片的基本使用
import numpy as npdata = np.arange(36).reshape(6, 6)
print(data)
# 打印第五行
print(data[5])
# 打印第3 ~ 5-1 行
print(data[3:5])
# 打印第0行,从第3到4的元素
print(data[0, 3:5])
# 打印第1行,从0到1的元素
print(data[1, :2])
# 打印第0行,从1到6-1步长为2
print(data[0, 1:6:2])
# 打印第2行第3个元素
print(data[2, 3])
# 打印前两行
print(data[:2])
# 打印第1到3行,第1到3列
print(data[1:3, 1:3])
输出结果
[[ 0 1 2 3 4 5][ 6 7 8 9 10 11][12 13 14 15 16 17][18 19 20 21 22 23][24 25 26 27 28 29][30 31 32 33 34 35]][30 31 32 33 34 35]
[[18 19 20 21 22 23][24 25 26 27 28 29]][3 4][1 3 5]15
[[ 0 1 2 3 4 5][ 6 7 8 9 10 11]][[ 7 8][13 14]][6 7]
1.5.2 花式(数组)索引的基本使用
arr = np.empty((4, 4))
for i in range(4):arr[i] = np.arange(i, i+4)
print(arr)
# 打印第0和2行
print(arr[[0, 2]])
# 获取(1, 0)和(3, 2)
print(arr[[1, 3], [0, 2]])
输出结果
[[0. 1. 2. 3.][1. 2. 3. 4.][2. 3. 4. 5.][3. 4. 5. 6.]][[0. 1. 2. 3.][2. 3. 4. 5.]][1. 5.]
1.5.3 布尔型
studentName = np.array(["Tom", "Amiya", "Theresa"])
studentScore = np.array([[79, 88, 89], [87, 65, 95], [74, 85, 61]])
print(studentName == "Amiya")
print(studentScore[studentName == "Amiya"])
print(studentScore[studentName == 'Theresa', :1])
输出结果
[False True False]
[[87 65 95]]
[[74]]
1.6 数组的转置和轴对称
arr = np.arange(12).reshape(3, 4)
print(arr)
# 使用T属性对arr转置
print(arr.T)
# 转置,0为x,1为y, 设置为1,0,代表xy互换
print(arr.transpose(1, 0))arr1 = np.arange(12).reshape(2, 2, 3)
print(arr1)
# 将xy互换
print(arr1.transpose(1, 0, 2))
# swapaxes是将n维数组中两个维度进行调换,xy互换
print(arr1.swapaxes(1, 0))
输出结果
[[ 0 1 2 3][ 4 5 6 7][ 8 9 10 11]]
------------------
[[ 0 4 8]
[ 1 5 9]
[ 2 6 10]
[ 3 7 11]]------------------
[[ 0 4 8][ 1 5 9][ 2 6 10][ 3 7 11]]------------------
[[[ 0 1 2][ 3 4 5]][[ 6 7 8][ 9 10 11]]]------------------
[[[ 0 1 2][ 6 7 8]][[ 3 4 5][ 9 10 11]]]------------------
[[[ 0 1 2][ 6 7 8]][[ 3 4 5][ 9 10 11]]]
1.7 numpy通用数组
import numpy as nparr1 = np.array([4, 8, 4, 2])
# 开方
print(np.sqrt(arr1))
# 取绝对值
arr2 = np.array([-1, 2, -10, -2])
print(np.abs(arr2))
# 求平方
print(np.square(arr2))
# 计算arr1和arr2的和
print(np.add(arr1, arr2))
# 计算两个数组的乘积
print(np.multiply(arr1, arr2))
# 多个数组取最大值
print(np.maximum(arr1, arr2))
# 执行元素级的比较操作
print(np.greater(arr1, arr2))
print(np.less(arr1, arr2))
输出结果
[2. 2.82842712 2. 1.41421356]
[ 1 2 10 2]
[ 1 4 100 4]
[ 3 10 -6 0]
[ -4 16 -40 -4]
[4 8 4 2]
[ True True True True]
[False False False False]
1.8 利用numpy数组进行数据处理
1.8.1 将条件逻辑转为数组运算
# true选第一个,false选第二个
arr1 = np.array([1, 2, 5])
arr2 = np.array([4, 7, 1])
con = np.array([True, False, False])
print(np.where(con, arr1, arr2))
输出结果
[1 7 1]
1.8.2 数组统计运算
arr = np.array([1, 2, -1, 7])
# 求和
print(arr.sum())
# 求平均值
print(arr.mean())
# 求最小值
print(arr.min())
# 求最大值
print(arr.max())
# 求最小值的索引
print(arr.argmin())
# 求最大值的索引
print(arr.argmax())
# 计算元素的累计和
print(arr.cumsum())
# 计算元素的累计积
print(arr.cumprod())
# np.diff()数组中后一个数减前一个数
# np.diff(a, n=1, axis=-1, prepend=<no value>, append=<no value>)[source]
# a: 数组, n:计算次数,axis: 0竖直减、1横着减
print(np.diff(arr))a = np.array([-0.7, 1.2, -1.2, 0.5])
# 向下取整
print(np.floor(a))
#向上取整
print(np.ceil(a))
# 实现大于0取原值,小于0取零
print(np.where(a>0, a, 0))
输出结果
9
2.25
-1
7
2
3
[1 3 2 9]
[ 1 2 -2 -14]
[ 1 -3 8]
[-1. 1. -2. 0.]
[-0. 2. -1. 1.]
[0. 1.2 0. 0.5]
数组排序
arr = np.array([[2, 1, 8], [8, 4, 1], [3, 9, 4]])
# 按行排序排序
arr.sort()
print(arr)
输出结果
[[1 2 8][1 4 8][3 4 9]]
arr = np.array([[2, 1, 8], [8, 4, 1], [3, 9, 4]])
# 按列排序
arr.sort(0)
print(arr)
输出结果
[[2 1 1][3 4 4][8 9 8]]
1.8.4 检索数组元素
# 检查是否有大于0的数
print(np.any(arr > 0))
# 检查是否所有元素都大于0
print(np.all(arr > 0))
1.8.5 唯一化及其他集合逻辑
a = np.array([1, 2, 4, 5, 1, 2, 4])
# 去重
print(np.unique(a))
# 输出序列a中元素与序列[1,5]是否相同
print(np.in1d(a, [1, 5]))
输出结果
[1 2 4 5]
[ True False False True True False False]
1.9 线性代数模块
# 矩阵乘法
arr1 = np.array([[1, 2, 3], [1, 2, 3]])
arr2 = np.array([[1, 2], [2, 2], [4, 1]])
print(arr1.dot(arr2))
print(np.dot(arr1, arr2))
输出结果
[[17 9][17 9]]
[[17 9][17 9]]
1.10 随机数模块
# 生成3x3的随机矩阵,值从0到1
print(np.random.rand(3, 3))
# 生成三维随机矩阵
print(np.random.rand(3, 3, 2))
# 设置种子
np.random.seed(0)
# 产生随机数
print(np.random.rand(5))
np.random.seed()
print(np.random.rand(5))
输出结果
[[0.91915309 0.3273642 0.48099848][0.30841312 0.5656747 0.98334858][0.29554889 0.18315713 0.47518993]][[[0.75420241 0.30841421][0.68911038 0.05800794][0.02904897 0.37479255]][[0.37839904 0.3322166 ][0.22317202 0.18784184][0.47441706 0.0337881 ]][[0.48213152 0.71993534][0.52116272 0.92980627][0.30824145 0.19018865]]][0.5488135 0.71518937 0.60276338 0.54488318 0.4236548 ][0.73906657 0.14488605 0.63462347 0.46018479 0.98655736]