Numpy简易入门

1.1 认识Numpy数组对象

1.1.1 导入NumPy工具包

#导包并起别名为np
import numpy as np

1.1.2 创建一个三行五列的数组

data = np.arange(15).reshap(3, 5)

打印结果： data

1.1.3 查询data类型

print(type(data))

打印结果：

<class 'numpy.ndarray'>
ndarray是一个N维数组类型的对象

1.1.4 查询数组维度的个数

print(data.ndim)

输出结果：

1.1.5 查询数组的形状

print(data.shape)

输出结果

(3, 5)

1.1.6 查询数组元素的个数

print(data.size)

输出结果

1.1.7 查询数组中元素的类型

print(data.dtype)

输出结果

int32

1.2 创建Numpy数组

1.2.1 创建一个一维数组并赋值

import numpy as np
data1 = np.array([1, 2, 3])
print(data1)

输出结果

[1 2 3]

1.2.2 创建一个二维数组并赋值

data2 = np.array([[1, 5, 1], [2, 4, 7]])

打印结果

[[1 5 1][2 4 7]]

1.2.3 创建一个全零数组

#默认为浮点型
data3 = np.zeros((3, 4))
#改为整型
data3 = np.zeros((3, 4), int)

输出结果

//默认
[[0. 0. 0. 0.]
[0. 0. 0. 0.]
[0. 0. 0. 0.]]
//整型
[[0 0 0 0]
[0 0 0 0]
[0 0 0 0]]

1.2.4 创建一个全1数组

data4 = np.ones((3, 4))

输出结果

[[1. 1. 1. 1.][1. 1. 1. 1.][1. 1. 1. 1.]]

1.2.5 创建一个全空数组

#其实是趋于0的数
data5 = np.empty((3, 4))

输出结果

[[1.06810268e-306 1.42419938e-306]
[7.56603881e-307 7.56600486e-307]
[1.02360867e-306 1.29061889e-306]
[6.23040373e-307 1.42419530e-306]
[1.60219035e-306 3.11529184e-307]]

1.2.6 以等差数列创建一个数组

#从1开始到20为止，步长为5
data6 = np.arange(1, 20, 5)

输出结果

[ 1  6 11 16]

1.2.7 创建一个浮点类型的数组

data7 = np.array([1, 2, 3, 0.1], float)

输出结果

[1.  2.  3.  0.1]

其他的也可以指定类型，比如：

data8 = np.ones((2, 3), dtype='float64')
#也可以这样写
#data8 = np.ones((2, 3), float)

输出结果

[[1. 1. 1.][1. 1. 1.]]

1.3 ndarry对象的数据类型

1.3.1 查看数据类型

data1 = np.array([[1, 2, 3], [4, 5, 6]])
print(data1.dtype.name)

输出结果

int32

1.3.2 转换数据类型

data2 = data1.astype(np.float64)
print(data2.dtype)data3 = np.array([1.2, 1.3, 1.4, 3.3])
data4 = data3.astype(np.int64)
print(data4.dtype)data5 = np.array(["1", "2", "3", '4'])
data6 = data5.astype(np.int64)
print(data6)
print(data6.dtype)

输出结果

float64
int64
[1 2 3 4]
int64

1.4 数组运算

1.4.1 向量化运算

import numpy as npdata1 = np.array([[1, 2, 3], [4, 5, 6]])
data2 = np.array([[-1, -4, 1], [7, 5, 2]])
#将第一个数组中的元素与第二个数组中对应的元素进行加减乘除
print(data1 + data2)
print(data1 - data2)
print(data1 * data2) 
print(data1 / data2)

输出结果

[[ 0 -2  4][11 10  8]][[ 2  6  2][-3  0  4]][[-1 -8  3][28 25 12]][[-1.         -0.5         3.        ][ 0.57142857  1.          3.        ]]

1.4.2 数组广播

数组间的基础运算是一对一，但是当两者不一样时。就会自动触发广播机制，
但有些无法扩展的会报错，比如:(行数，列数)， (3, 2) + (1, 3)报错

data3 = np.array([[1], [2], [3], [4]])
data4 = np.array([1, 2, 3])
print(data3 + data4)

输出结果

//相当于
1 1 1      1 2 3
2 2 2  +   1 2 3 
3 3 3      1 2 3
4 4 4      1 2 3[[2 3 4][3 4 5][4 5 6][5 6 7]]

1.4.3 数组与标量间的运算

将数组中每个元素与标量计算，返回计算后的数组

data8 = np.array([[2, 8, 4], [3, 5, 7], [2, 4, 9]])
x = 7
print(data8 + x)
print(x - data8)
print(data8 * x)
print(x / data8)

输出结果

[[ 9 15 11][10 12 14][ 9 11 16]]
[[ 5 -1  3][ 4  2  0][ 5  3 -2]]
[[14 56 28][21 35 49][14 28 63]]
[[3.5        0.875      1.75      ][2.33333333 1.4        1.        ][3.5        1.75       0.77777778]]

1.5 ndarray的索引和切片

1.5.1 整数索引和切片的基本使用

import numpy as npdata = np.arange(36).reshape(6, 6)
print(data)
# 打印第五行
print(data[5])
# 打印第3 ~ 5-1 行
print(data[3:5])
# 打印第0行，从第3到4的元素
print(data[0, 3:5])
# 打印第1行，从0到1的元素
print(data[1, :2])
# 打印第0行，从1到6-1步长为2
print(data[0, 1:6:2])
# 打印第2行第3个元素
print(data[2, 3])
# 打印前两行
print(data[:2])
# 打印第1到3行，第1到3列
print(data[1:3, 1:3])

输出结果

[[ 0  1  2  3  4  5][ 6  7  8  9 10 11][12 13 14 15 16 17][18 19 20 21 22 23][24 25 26 27 28 29][30 31 32 33 34 35]][30 31 32 33 34 35]
[[18 19 20 21 22 23][24 25 26 27 28 29]][3 4][1 3 5]15
[[ 0  1  2  3  4  5][ 6  7  8  9 10 11]][[ 7  8][13 14]][6 7]

1.5.2 花式(数组)索引的基本使用

arr = np.empty((4, 4))
for i in range(4):arr[i] = np.arange(i, i+4)
print(arr)
# 打印第0和2行
print(arr[[0, 2]])
# 获取(1, 0)和(3, 2)
print(arr[[1, 3], [0, 2]])

输出结果

[[0. 1. 2. 3.][1. 2. 3. 4.][2. 3. 4. 5.][3. 4. 5. 6.]][[0. 1. 2. 3.][2. 3. 4. 5.]][1. 5.]

1.5.3 布尔型

studentName = np.array(["Tom", "Amiya", "Theresa"])
studentScore = np.array([[79, 88, 89], [87, 65, 95], [74, 85, 61]])
print(studentName == "Amiya")
print(studentScore[studentName == "Amiya"])
print(studentScore[studentName == 'Theresa', :1])

输出结果

[False  True False]
[[87 65 95]]
[[74]]

1.6 数组的转置和轴对称

arr = np.arange(12).reshape(3, 4)
print(arr)
# 使用T属性对arr转置
print(arr.T)
# 转置，0为x，1为y, 设置为1,0，代表xy互换
print(arr.transpose(1, 0))arr1 = np.arange(12).reshape(2, 2, 3)
print(arr1)
# 将xy互换
print(arr1.transpose(1, 0, 2))
# swapaxes是将n维数组中两个维度进行调换,xy互换
print(arr1.swapaxes(1, 0))

输出结果

[[ 0  1  2  3][ 4  5  6  7][ 8  9 10 11]]
------------------
[[ 0  4  8]
[ 1  5  9]
[ 2  6 10]
[ 3  7 11]]------------------
[[ 0  4  8][ 1  5  9][ 2  6 10][ 3  7 11]]------------------
[[[ 0  1  2][ 3  4  5]][[ 6  7  8][ 9 10 11]]]------------------
[[[ 0  1  2][ 6  7  8]][[ 3  4  5][ 9 10 11]]]------------------
[[[ 0  1  2][ 6  7  8]][[ 3  4  5][ 9 10 11]]]

1.7 numpy通用数组

import numpy as nparr1 = np.array([4, 8, 4, 2])
# 开方
print(np.sqrt(arr1))
# 取绝对值
arr2 = np.array([-1, 2, -10, -2])
print(np.abs(arr2))
# 求平方
print(np.square(arr2))
# 计算arr1和arr2的和
print(np.add(arr1, arr2))
# 计算两个数组的乘积
print(np.multiply(arr1, arr2))
# 多个数组取最大值
print(np.maximum(arr1, arr2))
# 执行元素级的比较操作
print(np.greater(arr1, arr2))
print(np.less(arr1, arr2))

输出结果

[2.         2.82842712 2.         1.41421356]
[ 1  2 10  2]
[  1   4 100   4]
[ 3 10 -6  0]
[ -4  16 -40  -4]
[4 8 4 2]
[ True  True  True  True]
[False False False False]

1.8 利用numpy数组进行数据处理

1.8.1 将条件逻辑转为数组运算

# true选第一个，false选第二个
arr1 = np.array([1, 2, 5])
arr2 = np.array([4, 7, 1])
con = np.array([True, False, False])
print(np.where(con, arr1, arr2))

输出结果

[1 7 1]

1.8.2 数组统计运算

arr = np.array([1, 2, -1, 7])
# 求和
print(arr.sum())
# 求平均值
print(arr.mean())
# 求最小值
print(arr.min())
# 求最大值
print(arr.max())
# 求最小值的索引
print(arr.argmin())
# 求最大值的索引
print(arr.argmax())
# 计算元素的累计和
print(arr.cumsum())
# 计算元素的累计积
print(arr.cumprod())
# np.diff()数组中后一个数减前一个数
# np.diff(a, n=1, axis=-1, prepend=<no value>, append=<no value>)[source]
# a: 数组, n:计算次数，axis: 0竖直减、1横着减
print(np.diff(arr))a = np.array([-0.7, 1.2, -1.2, 0.5])
# 向下取整
print(np.floor(a))
#向上取整
print(np.ceil(a))
# 实现大于0取原值，小于0取零
print(np.where(a>0, a, 0))

输出结果

9
2.25
-1
7
2
3
[1 3 2 9]
[  1   2  -2 -14]
[ 1 -3  8]
[-1.  1. -2.  0.]
[-0.  2. -1.  1.]
[0.  1.2 0.  0.5]

数组排序

arr = np.array([[2, 1, 8], [8, 4, 1], [3, 9, 4]])
# 按行排序排序
arr.sort()
print(arr)

输出结果

[[1 2 8][1 4 8][3 4 9]]

arr = np.array([[2, 1, 8], [8, 4, 1], [3, 9, 4]])
# 按列排序
arr.sort(0)
print(arr)

输出结果

[[2 1 1][3 4 4][8 9 8]]

1.8.4 检索数组元素

# 检查是否有大于0的数
print(np.any(arr > 0))
# 检查是否所有元素都大于0
print(np.all(arr > 0))

1.8.5 唯一化及其他集合逻辑

a = np.array([1, 2, 4, 5, 1, 2, 4])
# 去重
print(np.unique(a))
# 输出序列a中元素与序列[1,5]是否相同
print(np.in1d(a, [1, 5]))

输出结果

[1 2 4 5]
[ True False False  True  True False False]

1.9 线性代数模块

# 矩阵乘法
arr1 = np.array([[1, 2, 3], [1, 2, 3]])
arr2 = np.array([[1, 2], [2, 2], [4, 1]])
print(arr1.dot(arr2))
print(np.dot(arr1, arr2))

输出结果

[[17  9][17  9]]
[[17  9][17  9]]

1.10 随机数模块

# 生成3x3的随机矩阵，值从0到1
print(np.random.rand(3, 3))
# 生成三维随机矩阵
print(np.random.rand(3, 3, 2))
# 设置种子
np.random.seed(0)
# 产生随机数
print(np.random.rand(5))
np.random.seed()
print(np.random.rand(5))

输出结果

[[0.91915309 0.3273642  0.48099848][0.30841312 0.5656747  0.98334858][0.29554889 0.18315713 0.47518993]][[[0.75420241 0.30841421][0.68911038 0.05800794][0.02904897 0.37479255]][[0.37839904 0.3322166 ][0.22317202 0.18784184][0.47441706 0.0337881 ]][[0.48213152 0.71993534][0.52116272 0.92980627][0.30824145 0.19018865]]][0.5488135  0.71518937 0.60276338 0.54488318 0.4236548 ][0.73906657 0.14488605 0.63462347 0.46018479 0.98655736]