【深度学习】2.视觉问题与得分函数

计算机视觉任务

image-20250118192415758

可以通过神经网络搜索是什么类别的动物。

image-20250118192518799

图像实际就是含有数值的三维矩阵。

像素值从0-255可以表示亮度递增的参数。数字越大,像素点越亮。

最后的3表示三个颜色通道,常见的如JPG、RGB等。

image-20250118192833762

现实场景容易发生各种遮蔽现象。

image-20250118192928952

计算机判断实际已经超越人眼。

因此深度学习需要大量的遮蔽类的数据作为依据,用来判断之后的图片是不是遮蔽的,这就是深度学习最需要的东西。你让他解决什么问题,就给他传入什么数据就可以了。

视觉任务遇到的问题

image-20250118193249581

image-20250118193312130

k=3时,算最近的三个像素块,哪个多绿点就变成哪个,因此绿色的点属于三角。即周围什么多他就是什么,这就是K近邻算法。

K=5时,范围内临近的方块变多,因此k=3与k=5结果是不一样的。

image-20250118193716777

用K近邻对图像进行分类:

image-20250118193951392

image-20250118194256579

矩阵对应元素相减后,得到B矩阵,B矩阵的元素数值之和作为一个判断标准,数值越小,表示测试image越像训练image。

选择最小的前一部分数据进行分类。

image-20250118194426983

有几张将车识别成了马,可以发现有些类别做的好,有些类别做的不好,所以存在问题。

image-20250118194524643

可以发现这类边框都是同类型的,但是主题不一样。因此在设计算法时,应该注重哪里是主体,哪里是边框或者背景。因此:

1

K近邻不知道哪里是主体,哪里是背景。

得分函数(神经网络)

image-20250118195332346

共32×32×3=3072个像素点(特征),像素点用f中的x表示;每个像素点的重要性都不一样,比如眼睛这个像素点对判断这个是猫起了促进的作用,背景这个像素点对判断这个是猫起了抑制的作用。所以得出,每个像素点对于当前图像的重要程度都不一样,重要程度用f中的W表示权重参数。0

因此,3072个像素点x对应3072个权重参数W。


看下当前这个式子:

image-20250118195921872

32×32×3=3072×1,即可以把猫这个图像看成3072行1列的矩阵。

对于公式, f ( x , W ) = W x + b f(x,W)=Wx+b f(x,W)=Wx+b

  • 首先Wx,W就是每一类物体的权重,因此可以用10个W来代替猫,狗,飞机,大炮…等十个物体,如下计算,通过矩阵运算得出猫,狗…等十个物体的最终信息10×1型矩阵。

image-20250120002212648

  • 对于b,叫它偏置参数。通常情况下,W(权重项)对结果起到决定性作用,而对于b(偏置项)则起到了一个微调的操作。所谓微调,接上面举例,就是将Wx的结果即10×1的矩阵再加上一个10×1的矩阵b,b的每一项对应一个物体,b矩阵中元素之间没有任何关系。

image-20250120002947351

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5560.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

本地 AI 模型“不实用”?

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

【Maui】下拉框的实现,绑定键值对

文章目录 前言一、问题描述二、解决方案三、软件开发(源码)3.1 创建模型3.2 视图界面3.3 控制器逻辑层 四、项目展示 前言 .NET 多平台应用 UI (.NET MAUI) 是一个跨平台框架,用于使用 C# 和 XAML 创建本机移动和桌面应用。 使用 .NET MAUI&…

AI守护煤矿安全生产:基于视频智能的煤矿管理系统架构解析

前言 本文我将介绍我和我的团队自主研发设计的一款AI产品的成果展示——“基于视频AI识别技术的煤矿安全生产管理系统”。 这款产品是目前我在创业阶段和几位矿业大学的博士共同从架构设计、开发到交付的全过程中首次在博客频道发布, 我之前一直想写但没有机会来整理这套系统的…

.NET开源的处理分布式事务的解决方案

前言 在分布式系统中,由于各个系统服务之间的独立性和网络通信的不确定性,要确保跨系统的事务操作的最终一致性是一项重大的挑战。今天给大家推荐一个.NET开源的处理分布式事务的解决方案基于 .NET Standard 的 C# 库:CAP。 CAP项目介绍 C…

计算机网络 (52)秘钥分配

一、重要性 在计算机网络中,密钥分配是密钥管理中的一个核心问题。由于密码算法通常是公开的,因此网络的安全性主要依赖于密钥的安全保护。密钥分配的目的是确保密钥在传输过程中不被窃取或篡改,同时确保只有合法的用户才能获得密钥。 二、方…

Open3D计算点云粗糙度(方法一)【2025最新版】

目录 一、Roughness二、代码实现三、结果展示博客长期更新,本文最近更新时间为:2025年1月18日。 一、Roughness 通过菜单栏的Tools > Other > Roughness找到该功能。 这个工具可以估计点云的“粗糙度”。 选择一个或几个点云,然后启动这个工具。 CloudCompare只会询问…

DDD - 整洁架构_解决技术设计困局

文章目录 Pre如何落地 DDD底层技术的更迭 整洁架构的设计主动适配器/北向适配器被动适配器/南向适配器 整洁架构的落地总结 Pre DDD - 软件退化原因及案例分析 DDD - 如何运用 DDD 进行软件设计 DDD - 如何运用 DDD 进行数据库设计 DDD - 服务、实体与值对象的两种设计思路…

一个软件分发和下载的网站源码,带多套模板

PHP游戏应用市场APP软件下载平台网站源码手机版 可自行打包APP,带下载统计,带多套模板,带图文教程 代码下载:百度网盘

OSPF协议部分解读

多年前所写, 主要是对OSPF的RFC协议标准的解读. 工作中接触网络路由协议OSPF的同学可以参考参考.如有理解错误请谅解, 不过可以肯定的是一定有理解错误的地方的. RFC2328 1.1小节 1. OSPF routes IP packets based solely on the destination IPaddress found in the IP pac…

安装wxFormBuilder

1. 网址:GitHub - wxFormBuilder/wxFormBuilder: A wxWidgets GUI Builder 2. 安装MSYS2 MSYS2可以在GitHub的内容中找到,这个版本是32位64位的 3. 在程序中打开MINGW64 shell 4. 在MSYS2 MINGW64 shell中输入 pacman -Syu pacman -S ${MINGW_PACKAGE…

基于微信小程序高校订餐系统的设计与开发ssm+论文源码调试讲解

第4章 系统设计 一个成功设计的系统在内容上必定是丰富的,在系统外观或系统功能上必定是对用户友好的。所以为了提升系统的价值,吸引更多的访问者访问系统,以及让来访用户可以花费更多时间停留在系统上,则表明该系统设计得比较专…

C#中的语句

C#提供了各式各样的语句,大多数是由C和C发展而来,当然,在C#中做了相应修改。语句和表达式一样,都是C#程序的基本组成部分,在本文我们来一起学习C#语句。 1.语句 语句是构造所有C#程序的过程构造块。在语句中可以声明…

微服务学习-Gateway 统一微服务入口

1. 微服务为什么需要 API 网关? 1.1. 在微服务架构中,通常一个系统会被拆分为多个微服务,面对多个微服务客户端应该如何去调用呢? 如果根据每个微服务的地址发起调用,存在如下问题: 客户端多次请求不同的…

linux-FTP服务配置与应用

也许你对FTP不陌生,但是你是否了解FTP到底是个什么玩意? FTP 是File Transfer Protocol(文件传输协议)的英文简称,而中文简称为 “文传协议” 用于Internet上的控制文件的双向传输。同时,它也是一个应用程序…

代码随想录算法训练营第 14 天(树2)| 226.翻转二叉树、101. 对称二叉树、104.二叉树的最大深度、111.二叉树的最小深度

一、#226.翻转二叉树 题目:https://leetcode.cn/problems/invert-binary-tree/ 视频:https://www.bilibili.com/video/BV1sP4y1f7q7 讲解:https://programmercarl.com/0226.%E7%BF%BB%E8%BD%AC%E4%BA%8C%E5%8F%89%E6%A0%91.html 注意这里交换…

基于微信小程序的科创微应用平台设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

【MySQL】数据库基础知识

欢迎拜访:雾里看山-CSDN博客 本篇主题:【MySQL】数据库基础知识 发布时间:2025.1.21 隶属专栏:MySQL 目录 什么是数据库为什么要有数据库数据库的概念 主流数据库mysql的安装mysql登录使用一下mysql显示数据库内容创建一个数据库创…

STM32学习9---EXIT外部中断(理论)

本文参考江科大和其他博主,侵删! 中断系统是管理和执行中断的逻辑结构 ,外部中断是产生中断的外设之一。 一、STM32中断 1、中断基本介绍 68个可屏蔽中断通道(中断源),包含EXTI外部、TIM定时器、ADC模数…

步入响应式编程篇(二)之Reactor API

步入响应式编程篇(二)之Reactor API 前言回顾响应式编程Reactor API的使用Stream引入依赖Reactor API的使用流源头的创建 reactor api的背压模式发布者与订阅者使用的线程查看弹珠图查看形成新流的日志 前言 对于响应式编程的基于概念,以及J…

66,【6】buuctf web [HarekazeCTF2019]Avatar Uploader 1

进入靶场 习惯性输入admin 还想用桌面上的123.png 发现不行 看看给的源码 <?php // 关闭错误报告&#xff0c;可能会隐藏一些错误信息&#xff0c;在开发阶段可考虑开启&#xff08;例如 error_reporting(E_ALL)&#xff09; error_reporting(0); // 引入配置文件&#x…