- 机器学习的一般步骤:数据搜集、数据清洗、特征工程、数学建模。
- 数据划分:训练集、验证集、测试集。
- K折交叉验证:解决数据量不够大问题,解决参数调优问题。
- 深度学习不用做特征工程,传统机器学习要。
- 损失函数,优化算法。
- 评价指标、混淆矩阵、准确率、精确率、召回率、F1 score。
- 机器学习分类:监督学习(分类、回归)、无监督学习(聚类、降维)、强化学习。
- 希腊字母发音:
- 先从导包学起,再考虑自己写个包出来。
有监督学习算法-朴素贝叶斯
- 用先验概率求后验概率
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A) - 解决问题:求一句话是某种类型的概率,求用户输入的拼音是否个词的概率
- 已经特别成熟了,不要作为研究的、优化的算法,并且初学运算过程不用理解的特别详细。