KNN-手写数字数据集:
使用sklearn中的KNN算法工具包( KNeighborsClassifier)替换实现分类器的构建,注意使用的是汉明距离;
分段解释代码:
import os import pandas as pd from Levenshtein import hamming
导入所需的库,包括os用于文件操作,pandas用于数据处理,以及hamming函数来计算字符串之间的汉明距离。
def get_train():path = 'digits/trainingDigits'trainingFileList0 = os.listdir(path)trainingFileList = [file[2:] if file.startswith('._') else file for file in trainingFileList0]train = pd.DataFrame()img