一、转换器
1、什么是转换器
之前做特征工程的步骤:
(1)第一步就是实例化了一个转换器类(Transformer)
(2)第二步就是调用fit_transform,进行数据的转换
2、我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
fit_transform()
fit()
transform()
3、例子
我们以标准化为例:(x - mean) / std
要进行转化的特征x减去这一列的平均值mean再除以标准差
第一步会执行fit(),计算每一列的平均值、标准差
第二步会执行transform(),用第一步计算出的结果,带入公式,进行最终的转换
二、估计器
1、什么是估计器
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
所有的机器学习算法都被封装到估计器当中
2、用于分类的估计器
(1)sklearn.neighbors:k-邻近算法
(2)sklearn.naive_bayes:朴素贝叶斯
(3)sklearn.linear_model.LogisticRegression:逻辑回归
(4)sklearn.tree:决策树与随机森林
3、用于回归的估计器
(1)sklearn.linear_model.LinearRegression:线性回归
(2)sklearn.linear_model.Ridge:岭回归
4、用于无监督学习的估计器
(1)sklearn.cluster.KMeans:聚类
三、估计器工作流程
1、实例化一个estimator
2、调用estimator.fit(x_train, y_train) 计算
在fit方法中,将训练集的特征值和目标值传进来
调用完毕,意味着模型生成
3、模型评估
(1)直接比对真实值和预测值
说明:x_test测试集、y_predict预测的结果、y_test测试集中的目标值
y_predict = estimator.predict(x_test)
比对 y_test == y_predict
(2)计算准确率
说明:accuracy准确率
accuracy = estimator.score(x_test, y_test)