语义分割 | 基于 VGG16 预训练网络和 Segnet 架构实现迁移学习

Hi,大家好,我是源于花海。本文主要使用数据标注工具 Labelme 对猫(cat)和狗(dog)这两种训练样本进行标注,使用预训练模型 VGG16 作为卷积基,并在其之上添加了全连接层。基于标注样本的信息和预训练模型的特征提取能力以及 Segnet 架构,训练自己构建的语义分割网络,从而实现迁移学习


目录

一、导入必要库

二、数据集准备

2.1 JSON 转换成 PNG

2.2 生成 JPG 图片和 mask 标签的名称文本

2.3 读取部分图片查看像素值

2.4 图片标签处理

三、模型构建

3.1 编码器搭建¶

3.2 解码器搭建

3.3 SegNet 模型搭建

四、模型训练

五、可视化训练结果

六、模型检测

七、总结

八、py 脚本文件

1. json_to_png.py

2. train_to_txt.py


一、导入必要库

导入必要的库(os、copy、numpy、matplotlib、PIL.Image、keras 等),为后续的图像处理和深度学习任务做准备。

#!/usr/bin/env python
# coding: utf-8
import os
import copy
import numpy as np
import matplotlib.pyplot as plt
from IPython.display import display
from PIL import Image
from keras.callbacks import EarlyStopping, ModelCheckpoint, ReduceLROnPlateau
from keras.layers import *
from keras.models import *
from keras.optimizers import Adam
from keras.utils.data_utils import get_file

二、数据集准备

构建迁移学习数据集,TL_CatDog 文件夹的结构如下(目录解释在括号里面):

├── TL_CatDog├── ckpt (训练权重)├── datasets (数据集总文件夹)├── Annotations (标注后的 JSON 文件)├── JPEGImages (训练集和测试集的猫狗原图)├── test├── train├── Segmentation├── train_and_val.txt (数据集名称和 mask 标签的 png 图像名称)├── SegmentationClass (语义分割的 mask 标签的 png 图像)

使用点标记法 Create Polygon 对 500 个猫狗待分割图像进行标注,如下图所示。

标注完成后会在同一指定目录下(./datasets/Annotation/)生成 JSON 文件,文件内容主要包括 version (labelme版本)、label (标签类别)、points (各个点坐标)、imagePath (图像路径)、imageHeight (图像高度)、imageWidth (图像宽度) 

2.1 JSON 转换成 PNG

见文末的 json_to_png.py 脚本文件。

2.2 生成 JPG 图片和 mask 标签的名称文本

见文末的 train_to_txt.py 脚本文件。

2.3 读取部分图片查看像素值

def values(image_path):# 打开图像image = Image.open(image_path)# 获取图像的像素数据pixels = list(image.getdata())# 使用集合来存储唯一的像素值unique_pixels = set(pixels)# 打印每个唯一像素的RGB值for pixel_value in unique_pixels:print(f"去重后像素值: {pixel_value}")image_path = "./datasets/SegmentationClass/467.png"
values(image_path)

去重后像素值: 0

去重后像素值: 1

去重后像素值: 2

2.4 图片标签处理

def generate_arrays_from_file(lines, batch_size):n = len(lines)i = 0while 1:X_train = []Y_train = []for _ in range(batch_size):if i == 0:np.random.shuffle(lines)  # 对数据进行随机排序,确保每个训练周期数据的顺序都是随机的。#   读取输入图片并进行归一化和resizename = lines[i].split(';')[0]img = Image.open("./datasets/JPEGImage/train/" + name)img = img.resize((WIDTH, HEIGHT), Image.BICUBIC)img = np.array(img) / 255X_train.append(img)#   读取标签图片并进行归一化和resizename = lines[i].split(';')[1].split()[0]label = Image.open("./datasets/SegmentationClass/" + name)# 通过将标签图像的大小调整为输入图像的一半,可以在减小计算开销的同时保留相对较高的语义信息。label = label.resize((int(WIDTH / 2), int(HEIGHT / 2)), Image.NEAREST)if len(np.shape(label)) == 3:  # 判断标签是不是彩色的,如果是就变为灰度图像label = np.array(label)[:, :, 0]label = np.reshape(np.array(label), [-1])  # 确保标签数据以一维形式被提供给后续的处理步骤。one_hot_label = np.eye(NCLASSES)[np.array(label, np.int32)]Y_train.append(one_hot_label)i = (i + 1) % nyield np.array(X_train), np.array(Y_train)

三、模型构建

3.1 编码器搭建¶

  • 这里采用 VGG16 的模型结构进行搭建网络

    目的:使得输入的图像进行多次卷积池化操作,提取图像中的各种特征以便后续训练使用

    • 这里只采用 VGG16 的前四次提取特征行为作为编码器
    • 编码器中的每个阶段都会保留一些特征信息,以供解码器在解码阶段使用。

  • 上述图进行举例说明,该网络结构与上述图所述类似,但图片尺寸不同。
def get_convnet_encoder(input_height=416, input_width=416):img_input = Input(shape=(input_height, input_width, 3))# 416,416,3 -> 208,208,64x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1')(img_input)x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2')(x)x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool')(x)f1 = x# 208,208,64 -> 104,104,128x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv1')(x)x = Conv2D(128, (3, 3), activation='relu', padding='same', name='block2_conv2')(x)x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool')(x)f2 = x# 104,104,128 -> 52,52,256x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv1')(x)x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv2')(x)x = Conv2D(256, (3, 3), activation='relu', padding='same', name='block3_conv3')(x)x = MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool')(x)f3 = x# 52,52,256 -> 26,26,512x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv1')(x)x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv2')(x)x = Conv2D(512, (3, 3), activation='relu', padding='same', name='block4_conv3')(x)x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool')(x)f4 = xreturn img_input, [f1, f2, f3, f4]

3.2 解码器搭建

解码器的目标是生成与输入数据相似的输出

  • 为了更容易求得训练过程当中的损失值,解码器在反卷积(上采样)过程中住处生成与标签类似的输出,将在训练后续进行图像尺寸还原。

注意:

  • ZeroPadding2D 的目的是:在图像边界进行零填充,目的是为了在后续的卷积操作中避免尺寸缩小
# 解码器的目标是生成与输入数据相似的输出
def segnet_decoder(f, n_classes, n_up=3):assert n_up >= 2o = f# 26,26,512 -> 26,26,512o = ZeroPadding2D((1, 1))(o)  # 在图像边界填充一个像素,这是为了避免上采样后图像尺寸减小o = Conv2D(512, (3, 3), padding='valid')(o)# 输出特征图的尺寸较小,因为不进行填充o = BatchNormalization()(o)# 进行一次 UpSampling2D,此时 hw 变为原来的1/8# 26,26,512 -> 52,52,256o = UpSampling2D((2, 2))(o)o = ZeroPadding2D((1, 1))(o)o = Conv2D(256, (3, 3), padding='valid')(o)o = BatchNormalization()(o)# 进行一次 UpSampling2D,此时 hw 变为原来的 1/4# 52,52,256 -> 104,104,128for _ in range(n_up-2):o = UpSampling2D((2, 2))(o)o = ZeroPadding2D((1, 1))(o)o = Conv2D(128, (3, 3), padding='valid')(o)o = BatchNormalization()(o)# 进行一次 UpSampling2D,此时 hw 变为原来的 1/2# 104,104,128 -> 208,208,64o = UpSampling2D((2, 2))(o)o = ZeroPadding2D((1, 1))(o)o = Conv2D(64, (3, 3), padding='valid')(o)o = BatchNormalization()(o)# 此时输出为 h_input/2, w_input/2, nclasses# 208,208,3o = Conv2D(n_classes, (3, 3), padding='same')(o)return o

3.3 SegNet 模型搭建

将编码器与解码器连接在一起,编码器通过多个卷积层和池化层逐渐减小特征图的空间分辨率,同时提取抽象的语义特征。解码器解码器通常包括上采样层,通过逐步上采样将特征图的分辨率增加,同时进行一些操作以恢复细节和位置信息。最终的输出是一个与输入图像具有相同尺寸的分割图。

最终采用 Softmax 计算像素类别概率进行分类。

主体如下图所示:

# SegNet 模型的构建函数
def _segnet(n_classes, encoder, input_height=416, input_width=416, encoder_level=3):# encoder 通过主干网络img_input, levels = encoder(input_height=input_height, input_width=input_width)# 获取 hw 压缩四次后的结果feat = levels[encoder_level]# 将特征传入 segnet 网络o = segnet_decoder(feat, n_classes, n_up=3)# 将结果进行 reshape,将其变成一维的形式,以准备进行 Softmax 操作o = Reshape((int(input_height / 2) * int(input_width / 2), -1))(o)# 将每个像素的得分映射到概率分布,表示图像中每个位置属于每个类别的概率。o = Softmax()(o)model = Model(img_input, o)return model# 构建一个基于 ConvNet 编码器和 SegNet 解码器的图像分割模型
def convnet_segnet(n_classes, input_height=416, input_width=416, encoder_level=3):model = _segnet(n_classes, get_convnet_encoder, input_height=input_height, input_width=input_width, encoder_level=encoder_level)model.model_name = "convnet_segnet"return modelmodel = convnet_segnet(n_classes=3, input_height=416, input_width=416, encoder_level=3)
model.summary()  # 打印模型摘要

四、模型训练

VGG介绍: VGG 是一种深度卷积神经网络,由牛津大学视觉几何组(Visual Geometry Group)在 2014 年提出。它是由多个卷积层和池化层组成的深度神经网络,具有很强的图像分类能力,特别是在图像识别领域,取得了很好的成果。这里我们将把这个网络迁移到本项目中。

  • 使用 VGG16 进行迁移学习
  • 将 VGG16 权重加载加入编码器部分,使其可以利用已经训练好的权重进行特征提取,帮助节省训练时间,并且可以有更好的提取效果。
  • 提高模型的泛化能力和性能。
HEIGHT = 416
WIDTH = 416
NCLASSES = 3
ckpt_dir = "./ckpt/"def train():# 下载预训练权重,如果有则可直接调用model = convnet_segnet(n_classes=NCLASSES, input_height=HEIGHT, input_width=WIDTH)WEIGHTS_PATH_NO_TOP = 'https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5'weights_path = get_file('vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5', WEIGHTS_PATH_NO_TOP, cache_subdir='models')model.load_weights(weights_path, by_name=True)# 打开数据集的txtwith open("./datasets/Segmentation/train_and_val.txt", "r") as f:lines = f.readlines()# 打乱的数据更有利于训练,90% 用于训练,10% 用于估计。np.random.seed(10101)np.random.shuffle(lines)np.random.seed(None)num_val = int(len(lines) * 0.1)num_train = len(lines) - num_val# checkpoint 用于设置权值保存的细节,period 用于修改多少 epoch 保存一次checkpoint = ModelCheckpoint(ckpt_dir + 'ep{epoch:03d}-loss{loss:.3f}-val_loss{val_loss:.3f}.h5',monitor='val_loss', save_weights_only=True, save_best_only=False, period=2)# 当损失值停滞不前时,动态地减小学习率以提高模型的收敛性reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=3, verbose=1)# 损失值在一定 epoch 数内没有明显的改善,就触发早停操作,以避免过度拟合,提前结束训练。early_stopping = EarlyStopping(monitor='val_loss', min_delta=0, patience=10, verbose=1)trainable_layer = 10for i in range(trainable_layer):model.layers[i].trainable = Falseprint('freeze the first {} layers of total {} layers.'.format(trainable_layer, len(model.layers)))if True:lr = 1e-3batch_size = 4model.compile(loss='categorical_crossentropy',optimizer=Adam(lr=lr),metrics=['accuracy'])print('Train on {} samples, val on {} samples, with batch size {}.'.format(num_train, num_val, batch_size))history = model.fit(generate_arrays_from_file(lines[:num_train], batch_size),steps_per_epoch=max(1, num_train//batch_size),validation_data=generate_arrays_from_file(lines[num_train:], batch_size),validation_steps=max(1, num_val//batch_size),epochs=20,callbacks=[checkpoint, reduce_lr, early_stopping])return historyhistory = train()

五、可视化训练结果

经过 20 轮的训练后,基于下方的 "loss/acc" 的可视化图,可以看出训练集准确率能达到 83 %验证集准确率能达到 79 %训练集损失率最低达到 40%验证集损失率最低达到 49% ,可见网络模型的性能良好。

def plot_training_history(history):plt.figure(figsize=(7, 4))plt.plot(history.history['accuracy'], color='green', label='train_acc')  # 训练集准确率plt.plot(history.history['val_accuracy'], color='blue', label='val_acc')  # 验证集准确率plt.plot(history.history['loss'], color='orange', label='train_loss')  # 训练集损失率plt.plot(history.history['val_loss'], color='red', label='val_loss')  # 验证集损失率plt.title('Vgg16_Segnet Model')plt.xlabel('Epochs', fontsize=12)plt.ylabel('loss/acc', fontsize=12)plt.legend(fontsize=11)plt.ylim(0, 2)  # 设置纵坐标范围为 0-2plt.show()plot_training_history(history)


六、模型检测

在上述训练中,我们定义了三个类别分别为 cat、dog、blackgroup,在接下来检测过程当中,我们将分别将待检测图片转化为上述构建模型所需形式,带入已经训练好的模型进行像素值类别判断,并且赋予其类别颜色,这里背景颜色为黑色,猫的颜色为红色狗的颜色为绿色

# 模型检测
if __name__ == "__main__":class_colors = [[0, 0, 0], [0, 255, 0],[255,0,0]]HEIGHT = 416WIDTH = 416NCLASSES = 3model = convnet_segnet(n_classes=NCLASSES, input_height=HEIGHT, input_width=WIDTH)model_path = "./ckpt/ep020-loss0.387-val_loss0.496.h5"model.load_weights(model_path)test_dir = "./datasets/JPEGImage/test/"test_seg_dir = "./datasets/JPEGImage/test_seg/"test_seg_img_dir = "./datasets/JPEGImage/test_seg_img/"# 对 test 文件夹进行一个遍历imgs = os.listdir(test_dir)for jpg in imgs:# 打开 imgs 文件夹里面的每一个图片img = Image.open(test_dir + jpg)old_img = copy.deepcopy(img)orininal_h = np.array(img).shape[0]orininal_w = np.array(img).shape[1]# 对输入进来的每一个图片进行 Resize# resize 成 [HEIGHT, WIDTH, 3]img = img.resize((WIDTH, HEIGHT), Image.BICUBIC)img = np.array(img) / 255img = img.reshape(-1, HEIGHT, WIDTH, 3)# 将图像输入到网络当中进行预测pr = model.predict(img)[0]pr = pr.reshape((int(HEIGHT / 2), int(WIDTH / 2), NCLASSES)).argmax(axis=-1)# 创建一副新图,并根据每个像素点的种类赋予颜色seg_img = np.zeros((int(HEIGHT / 2), int(WIDTH / 2), 3))for c in range(NCLASSES):seg_img[:, :, 0] += ((pr[:, :] == c) * class_colors[c][0]).astype('uint8')seg_img[:, :, 1] += ((pr[:, :] == c) * class_colors[c][1]).astype('uint8')seg_img[:, :, 2] += ((pr[:, :] == c) * class_colors[c][2]).astype('uint8')seg_img = Image.fromarray(np.uint8(seg_img)).resize((orininal_w, orininal_h))  # 将数组转化为图像seg_img.save(test_seg_dir + jpg)image = Image.blend(old_img, seg_img, 0.5)image.save(test_seg_img_dir + jpg)# 定义读取文件夹图像函数
def display_image_collage(folder_path, rows, columns):# 获取文件夹下所有图片文件image_files = [f for f in os.listdir(folder_path) if f.endswith('.jpg') or f.endswith('.png')]# 计算每个图像的宽度和高度image_width, image_height = Image.open(os.path.join(folder_path, image_files[0])).size# 创建一个新的大图像output_image = Image.new('RGB', (columns * image_width, rows * image_height))# 遍历图像文件并将其粘贴到大图像中for i, image_file in enumerate(image_files):image_path = os.path.join(folder_path, image_file)image = Image.open(image_path)row = i // columnscol = i % columnsoutput_image.paste(image, (col * image_width, row * image_height))display(output_image)

语义分割的预测结果如下图:


七、总结

在该项目当中,采用 VGG16 与 SegNet 相结合的方式,利用迁移学习,将已经训练好的权重文件加载到自己所搭建的网络当中进行特征提取,这帮助我们大大节省了训练时间,并且可以提高模型的泛化能力与性能。

  • 不足之处:训练准确率不太高,后续我将继续改进。
  • 将采用其他网络进行迁移学习,几者对比学习。

八、py 脚本文件

1. json_to_png.py

import json
import os
import os.path as osp
import sys
import PIL.Image
import yaml
from labelme import utilsdef main():# JSON 文件夹路径,包含多个 JSON 格式文件json_file = "./datasets/Annotations"# 获取 JSON 文件列表count = os.listdir(json_file)# 遍历 JSON 文件列表for i in range(0, len(count)):# 拼接 JSON 文件路径path = os.path.join(json_file, count[i])  # ./datasets/Annotations/image00005.json# 判断路径是否为文件if os.path.isfile(path):# 读取 JSON 文件数据data = json.load(open(path))# 生成保存文件名,将点替换为下划线save_file_name = osp.basename(path).replace('.', '_')  # image00001_json# 创建 labelme_json 文件夹路径labelme_json = os.path.join(json_file, 'labelme_json')  # ./datasets/Annotations/labelme_json# 如果文件夹不存在,则创建if not osp.exists(labelme_json):os.mkdir(labelme_json)# 创建 labelme_json/image00001_json 文件夹路径out_dir = os.path.join(labelme_json, save_file_name)# 如果文件夹不存在,则创建if not osp.exists(out_dir):os.mkdir(out_dir)# 如果 JSON 文件中存在图像数据if data['imageData']:imageData = data['imageData']else:print("当前 json 文件没有查到 imageData")sys.exit()# 将 base64 编码的图像数据转换为数组img = utils.img_b64_to_arr(imageData)# 定义标签名到标签值的映射关系label_name_to_value = {'_background_': 0, 'cat': 1, "dog": 2}# 遍历 JSON 文件中的标注形状for shape in data['shapes']:label_name = shape['label']# 如果标签名在映射关系中,则获取标签值if label_name in label_name_to_value:label_value = label_name_to_value[label_name]else:print(f"当前label_name:{label_name}不在已设定的label_name_to_value中")sys.exit()# label_values 必须是连续的label_values, label_names = [], []for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]):label_values.append(lv)label_names.append(ln)# 将标注形状转换为标签数组lbl_info = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)lbl = lbl_info[0]# 保存图像,使用与 JSON 文件相同的文件名img_save_path = os.path.join(out_dir, save_file_name + '.png')lbl_save_path = os.path.join(out_dir, save_file_name + '_label.png')PIL.Image.fromarray(img).save(img_save_path)utils.lblsave(lbl_save_path, lbl)# 保存标签名到文件with open(os.path.join(out_dir, 'label_names.txt'), 'w') as f:for lbl_name in label_names:f.write(lbl_name + '\n')# 保存标签信息到 YAML 文件info = dict(label_names=label_names)with open(os.path.join(out_dir, 'info.yaml'), 'w') as f:yaml.safe_dump(info, f, default_flow_style=False)# 保存标签图像到 SegmentationClass 文件夹,以与 JSON 文件一一对应segmentation_class_folder = os.path.join(os.path.dirname(json_file), 'SegmentationClass')# 如果文件夹不存在,则创建if not osp.exists(segmentation_class_folder):os.mkdir(segmentation_class_folder)# 保存标签图像到 SegmentationClass 文件夹,以与 JSON 文件一一对应lbl_save_path = os.path.join(segmentation_class_folder, f"{save_file_name[:-5]}.png")utils.lblsave(lbl_save_path, lbl)print('Saved to: %s' % out_dir)if __name__ == '__main__':main()

2. train_to_txt.py

# 指定图片文件夹路径
folder_path = "./datasets/JPEGImage/train"
# 输出文本文件路径
output_file_path = "datasets/Segmentation/train_and_val.txt"# 遍历文件夹中的所有文件
with open(output_file_path, 'w') as output_file:# 遍历编号从 0 到 499for number in range(500):# 构建原始文件名original_filename = f"{number}.jpg"# 构建新文件名new_filename = f"{number}.png"# 写入文本文件output_file.write(f"{original_filename};{new_filename}\n")print("生成文件列表完成")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/247500.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uni-app 接口封装,token过期,自动获取最新的token

一、文件路径截图 2、新建一个文件app.js let hosthttp://172.16.192.40:8083/jeecg-boot/ //本地接口 let myApi {login: ${host}wx/wxUser/login, //登录 } module.exports myApi 3、新建一个文件request.js import myApi from /utils/app.js; export const r…

MySQL知识点总结(二)——explain执行计划、SQL优化

MySQL知识点总结(二)——explain执行计划、SQL优化 explain执行计划typepossible_keyskeysextra SQL优化SQL优化的流程SQL优化技巧范围查询优化排序优化分组查询优化distinct优化分页查询优化join关联查询优化排序分页 关联查询分组 关联查询 排序in与…

力扣hot100 实现Trie(前缀树) 字典树 一题双解

Problem: 208. 实现 Trie (前缀树) 文章目录 思路复杂度💝 TrieNode版💝 二维数组版 思路 👩‍🏫 宫水三叶 复杂度 💝 TrieNode版 public class Trie {class TrieNode{boolean end;//标记是否有以当前节点为结尾的字…

一文学习Thrift RPC

Thrift RPC引言 Thrift RPC的特点 Thrift 是一个RPC的框架,和Hessian RPC有什么区别,最重要的区别是Thrift可以做异构系统开发。 什么是异构系统,服务的提供者和服务的调用者是用不同语言开发的。 为什么会当前系统会有异构系统的调用&…

XPath判断当前选中节点的元素类型 Python lxml判断当前Element的元素类型 爬虫爬取页面分元素类型提取纯文本

背景&前言 不知道你们做爬虫的时候,有没有碰到和我一样的情况:将页面提取成纯文本的时候,由于页面中各种链接、加粗字体等,直接提取会造成结果一坨一坨的,非常不规整。有时候还要自己对标题等元素进行修改&#x…

14.java集合

文章目录 概念Collection 接口概念示例 Iterator 迭代器基本操作:并发修改异常增强循环遍历数组:遍历集合:遍历字符串:限制 list接口ListIteratorArrayList创建 ArrayList:添加元素:获取元素:修…

【Unity】粒子贴图异常白边问题

从PS制作的黑底,白光的贴图。放入Unity粒子中,拉远看会有很严重的白边,像马赛克一样。 材质使用:Mobile/Particles/Additive 经测试只使用一张黑色的图片,也会有白边。 解决方案: 关闭黑色底&#xf…

【UE 材质】闪电材质

效果 步骤 1. 新建一个材质这里命名为“M_Lighting” 打开“M_Lighting”,设置混合模式为半透明,着色模型为无光照 在材质图表中添加如下节点 其中,纹理采样节点的纹理是一个线条 此时预览窗口中效果如文章开头所示。

自然语言NLP学习

2-7 门控循环单元(GRU)_哔哩哔哩_bilibili GRU LSTM 双向RNN CNN 卷积神经网络 输入层 转化为向量表示 dropout ppl 标量 在物理学和数学中,标量(Scalar)是一个只有大小、没有方向的量。它只用一个数值就可以完全…

第十三章认识Ajax(四)

认识FormData对象 FormData对象用于创建一个表示HTML表单数据的键值对集合。 它可以用于发送AJAX请求或通过XMLHttpRequest发送表单数据。 以下是FormData对象的一些作用: 收集表单数据:通过将FormData对象与表单元素关联,可以方便地收集表…

AF647-羧酸,Alexa-Fluor 647-羧酸,适合用于标记蛋白质

您好,欢迎来到新研之家 文章关键词:AF647-carboxylic-acid ,AF647-COOH,AF647-acid,Alexa-Fluor 647-acid,AF647-羧酸,Alexa-Fluor 647-羧酸 一、基本信息 产品简介:AF647&#x…

周报(20240128)

日期:2024.1.22 - 2024.1.28 本周工作: 1. 阅读论文 本周阅读了以下论文: 《BRAU-Net:用于医学图像分割的U形混合CNN-Transformer网络》 背景 精确的医学图像分割对于临床量化、疾病诊断、治疗计划和许多其他应用至关重要。基…

深度学习核心技术与实践之深度学习研究篇

非书中全部内容,只是写了些自认为有收获的部分。 Batch Normalization 向前传播 (1)三个主要任务:计算出每批训练数据的统计量。 对数据进行标准化 对标…

赛氪荣获“2023天津高新技术企业大会支持单位”

1月23日上午,2023天津市高新技术企业大会新闻发布会在天开高教科技园核心区综合服务中心召开,市高企协以及来自高校、企业、社会组织等80余人现场参会。 大会组委会秘书长张博航介绍到:“本次大会将实现自开办以来的多个首次,首次…

AIDL实践

先贴最后的文件目录: aidl/android/hardware/demo/IFoo.aidl: package android.hardware.demo;import android.hardware.demo.IFooCallback;VintfStability interface IFoo {void doFoo();int doFooWithParameter(int param);void registerCallback(IFo…

案例分析技巧-软件工程

一、考试情况 需求分析(※※※※)面向对象设计(※※) 二、结构化需求分析 数据流图 数据流图的平衡原则 数据流图的答题技巧 利用数据平衡原则,比如顶层图的输入输出应与0层图一致补充实体 人物角色:客户、…

力扣3. 无重复字符的最长子串(滑动窗口)

Problem: 3. 无重复字符的最长子串 文章目录 题目描述思路及解法复杂度Code 题目描述 思路及解法 由于题目要求求出字符串中最长的连续无重复字符的最长子串,所以利用这个特性我们可以比较容易的想到利用双指针中的滑动窗口技巧来解决,但在实际的求解中…

[机器学习]简单线性回归——梯度下降法

一.梯度下降法概念 2.代码实现 # 0. 引入依赖 import numpy as np import matplotlib.pyplot as plt# 1. 导入数据(data.csv) points np.genfromtxt(data.csv, delimiter,) points[0,0]# 提取points中的两列数据,分别作为x,y …

从CNN ,LSTM 到Transformer的综述

前情提要:文本大量参照了以下的博客,本文创作的初衷是为了分享博主自己的学习和理解。对于刚开始接触NLP的同学来说,可以结合唐宇迪老师的B站视频【【NLP精华版教程】强推!不愧是的最完整的NLP教程和学习路线图从原理构成开始学&a…

TCP_拥塞控制

引言 24年春节马上就要到了,作为开车党,最大的期盼就是顺利回家过年不要堵车。梦想是美好的,但现实是骨感的,拥堵的道路让人苦不堪言。 在网络世界中,类似于堵车的问题也存在,而TCP(Transmissi…