实验11 机器学习-贝叶斯分类器
一、实验目的
(1)理解并熟悉贝叶斯分类器的思想和原理;
(2)熟悉贝叶斯分类器的数学推导过程;
(3)能运用贝叶斯分类器解决实际问题并体会算法的效果;
(4)熟悉sklearn与贝叶斯分类器相关的机器学习开源库,并使用开源库,对乳腺肿瘤数据进行分类。
二、实验内容
1、使用Python开发工具,运行对iris数据进行分类的例子程序NaiveBayes.py(根据你使用的是jupyter notebook,还是pycharm,可能需要对代码做适当修改),熟悉sklearn机器实习开源库。
运行结果如下:
2、登录https://archive-beta.ics.uci.edu/,界面如下:
可以查看提供的各类公共数据源,找到Breast Cancer Wisconsin (Original)数据并下载。也可以直接输入网址:
https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/
下载wisconsin提供的乳腺肿瘤数breast-cancer-wisconsin.data(已经处理好的数据)和breast-cancer-wisconsin.names(对数据的说明,可以用写字体打开)
数据如下:
3、使用sklearn机器学习开源库,使用贝叶斯分类器对breast-cancer-wisconsin.data进行分类。
运行结果:
4、(选做)用java实现贝叶斯分类器算法,并对上述数据进行分类。
结果如下:
三、实验体会与总结
本次实验聚焦贝叶斯分类器,透彻掌握其原理与推导。用 sklearn 处理乳腺肿瘤数据,经调优克服失衡、参数难题,结果良好。