论文学习 BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis

论文学习 BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis

  • 前言
  • 简介
  • NeRF介绍
  • BioNeRF
    • 位置编码提取
    • 感知过滤
    • 记忆更新
    • 纹理推断
    • 损失函数
  • 量化验证
  • 总结

前言

虽然我不应该再看NeRF相关的东西了,但是我还是觉得这个论文的题目很有意思,毕竟我认为神经网络本来就是模拟生物大脑的一个模型,那么我们应该更多的注意一些生物的机制,这些机制如果能得以很好的建模,或许能为神经网络结构下一步的开发提供思路。

简介

不同于NeRF依赖神经网络的权重来存储三维信息,BioNeRF利用感知启发的方式来融合多种输入,来改进模型中的记忆模块。并且该模型模拟了视锥细胞的功能,使其专注于纹理信息的提取。因此在这个意义上,记忆模块实际上是对形状信息和纹理信息进行组合。

论文链接
GitHub

(ps.感觉有种水论文讲故事的感觉)

NeRF介绍

在这里插入图片描述
( R , G , B , Δ ) = F θ ( x , y , z , θ , ϕ ) c ( x , y , z , θ , ϕ ) = ∫ ( R , G , B ) i Δ i d i (R,G,B, \Delta)=F_\theta(x,y,z,\theta,\phi) \\ c(x,y,z,\theta,\phi )=\int(R,G,B)_i\Delta_idi (R,G,B,Δ)=Fθ(x,y,z,θ,ϕ)c(x,y,z,θ,ϕ)=(R,G,B)iΔidi
NeRF本质上是利用一个MLP,来对一个五元组输入,输出一个四位输出,包含当前点的RGB三色,以及其密度 Δ \Delta Δ。因此可以认为,物体的三维信息实际上保存在模型参数中。这也极大的节省了内存,是一种高效利用内存的技术。

NeRF其中一个关键概念是,它将复杂的真实世界的三维表示编码为神经网络的参数。此外,该模型将体积密度预测限制为相机位置的函数,从而允许RGB颜色预测为位置和观看方向的函数。这些概念类似于受神经科学发现和锥体细胞原理启发的一些生物学上更合理的研究,特别是关于引导信息流的环境和整合记忆的想法,负责根据过去的经验提供额外的环境。

BioNeRF

在这里插入图片描述

位置编码提取

在这里插入图片描述
第一步,将图像输入同时输入两个独立的神经网络 M Δ , M c M_\Delta, M_c MΔ,Mc,两者的结构虽然相同,但是并不共享参数。

感知过滤

ps . 我们称这些为过滤的主要原始是,他会将输入特征映射到[0,1]区间。
这一阶段主要是针对上一阶段得到的特征编码进行进一步计算,有四种过滤方式:密度 f Δ f_\Delta fΔ、颜色 f c f_c fc、记忆 f Ψ f_\Psi fΨ、调整(调制) f μ f_\mu fμ
f Δ = σ ( h Δ ) f c = σ ( h c ) f Ψ = σ ( W Ψ [ h Δ , h c ] + b Ψ ) f μ = σ ( W μ [ h Δ , h c ] + b μ ) f_\Delta = \sigma(h_\Delta) \\ f_c = \sigma(h_c) \\ f_\Psi = \sigma(W_\Psi[h_\Delta,h_c]+b_\Psi) \\ f_\mu = \sigma(W_\mu[h_\Delta,h_c]+b_\mu) fΔ=σ(hΔ)fc=σ(hc)fΨ=σ(WΨ[hΔ,hc]+bΨ)fμ=σ(Wμ[hΔ,hc]+bμ)
其中 σ \sigma σ是sigmoid函数。

预调制 γ \gamma γ满足:
γ = t a n h ( W γ [ h Δ , h c ] + b γ ) \gamma = tanh(W_\gamma[h_\Delta,h_c]+b_\gamma) γ=tanh(Wγ[hΔ,hc]+bγ)

记忆更新

首先需要先进行一步计算如下。·
μ = f μ ⊗ γ \mu = f_\mu \otimes \gamma μ=fμγ

作为新的信息,之后用下式更新记忆内容:
Ψ = t a n h ( W Ψ ( μ + ( f Ψ ⊗ Ψ ) ) + b Ψ ) \Psi=tanh(W_\Psi(\mu+(f_\Psi\otimes\Psi)) + b_\Psi) Ψ=tanh(WΨ(μ+(fΨΨ))+bΨ)

纹理推断

利用前文更新的记忆以及得到的结果,还有相机位姿,concat得到新的特征 h Δ ′ , h c ′ h'_\Delta,h'_c hΔ,hc:
h Δ ′ = [ Ψ ⊗ f Δ , I ] h c ′ = [ Ψ ⊗ f c , d ] I = ( x , y , z ) d = ( θ , ϕ ) h'_\Delta=[\Psi\otimes f_\Delta,I]\\ h'_c=[\Psi \otimes f_c, d]\\ I=(x,y,z)\\d=(\theta,\phi) hΔ=[ΨfΔ,I]hc=[Ψfc,d]I=(x,y,z)d=(θ,ϕ)
再利用两个独立的神经网络作为解码器,得到 c , Δ c, \Delta c,Δ

损失函数

就是纯粹的损失函数。

量化验证

在这里插入图片描述

总结

感觉还是有点失望吧,这篇文章虽然说,是模仿生物视觉成像,不过依然存在以下问题:

  1. 生物中的记忆力表示,能否仅仅表示为一个张量呢?这种记忆力,是否可能也是作为一个神经网络,以参数的形式进行表示呢?
  2. 对比CodeNeRF,PixelNeRF等单视点成像的NeRF研究而言,改模型甚至难以单视点成像,是否说明其本身对于三维形状的提取还不如前两篇文章呢?
  3. 实际上不难发现,这篇文章提到的神经网络实际上参数量很大,性能的提升,是否可能主要受到参数量的影响呢?
  4. 这种记忆力机制,能否由一个Triplane来表示呢?感觉应该能起到相同的效果,甚至说,如果你认为Triplane不行,我们可以造两个Triplane,分别表示色彩和形状?如此说来这不是更复合生物特征?
  5. 文中提到的记忆力更新,感觉可以类比为一种kqv的注意力机制不是吗?感觉有编故事的嫌疑。

优点:
1.提到了记忆机制,这或许为解释Triplane在NeRF中非常有效的原因,因为Triplane实际上提供了一种记忆机制。
2.结果好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/262245.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 是什么

文章目录 一、ChatGPT 是什么二、ChatGPT的发明者三、ChatGPT的运作方式四、ChatGPT的技术五、ChatGPT的优势六、ChatGPT的局限性七、ChatGPT的应用八、ChatGPT的未来九、总结 一、ChatGPT 是什么 OpenAI的ChatGPT,即Chat Generative Pre-Trained Transformer&…

Sora来袭,蹭一波AI热潮|GPT · 重点梳理 -- 什么是ChatGPT,能干嘛,怎么用?

课程安排 学习内容 第一章 2024年AI领域最新技术 1.OpenAI新模型-GPT-5 2.谷歌新模型-Gemini Ultra 3.Meta新模型-LLama3 4.科大讯飞-星火认知 5.百度-文心一言 6.MoonshotAI-Kimi 7.智谱AI-GLM-4 第二章 OpenAI开发者大会后GPT最新技术 1.最新大模型GPT-4 Turbo详细介绍…

(done) 什么是特征值和特征向量?如何求特征值的特征向量 ?如何判断一个矩阵能否相似对角化?

什么是齐次方程? https://blog.csdn.net/shimly123456/article/details/136198159 行列式和是否有解的关系? https://blog.csdn.net/shimly123456/article/details/136198215 特征值和特征向量 参考视频:https://www.bilibili.com/video/BV…

HTML5新婚、年会、各种聚会的现场抽奖活动(附源码)

文章目录 1.抽奖平台设计来源1.1 主界面效果1.2 抽奖效果1.3 中奖效果 2.效果和源码配置2.1 动态效果2.2 人员信息配置2.3 奖品信息配置2.4 抽奖音效配置2.5 源代码 源码下载 作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_43151418/article/deta…

【kubernetes】二进制部署k8s集群之cni网络插件flannel和calico工作原理(中)

↑↑↑↑接上一篇继续部署↑↑↑↑ 目录 一、k8s集群的三种接口 二、k8s的三种网络模式 1、pod内容器之间的通信 2、同一个node节点中pod之间通信 3、不同的node节点的pod之间通信 Overlay Network VXLAN 三、flannel网络插件 1、flannel插件模式之UDP模式&#xff0…

Linux网络编程套接字

目录 前言 一、预备知识 1.1 源IP地址和目的IP地址 1.2 区分端口号和进程ID 1.3 TCP协议和UDP协议 1.4 网络字节序 二、socket编程接口 2.1 socket套接字的概念 2.2 socket常见API 2.3 sockaddr结构 三、关于IP和Port的绑定问题 四、编写简单的UDP服务端和客户端 前…

基于Python网络爬虫的IT招聘就业岗位可视化分析推荐系统(完整系统源码+数据库+详细文档)

文章目录 基于Python网络爬虫的IT招聘就业岗位可视化分析推荐系统(完整系统源码数据库详细文档)源码获取在文章末尾项目概述招聘岗位数据爬虫分析系统展示用户注册登录系统首页IT招聘数据开发岗-javaIT招聘数据开发岗-PythonIT招聘数据开发岗-Android算法…

通过Jmeter压测存储过程

一、存储过程准备: 1、建立一个空表: CREATE TABLE test_data ( id NUMBER, name VARCHAR2(50), age NUMBER ); 2、建立一个存储过程: CREATE OR REPLACE PROCEDURE insert_test_data (n IN NUMBER) AS BEGIN--EXECUTE IMMEDIATE truncat…

如何高效率完成软件开发?试试低代码

一、前言 对于一个非技术出身的软件行业从业者而言,理解技术是一道坎,但也是向上发展所必须跨越的一道坎。在一个软件公司,无论是商务、售前还是项目经理亦或者是产品经理,对技术的理解程度,往往意味着他的专业程度。而…

开发Chrome插件,background.js中log打印未出现在控制台

不同于内容脚本(通常命名content.js),在后台脚本(通常命名background.js或service-worker.js)中console.log并不会在控制台中直接显示。 要查看后台脚本上下文的正确控制台,执行如下步骤: 访问…

Facebook Horizon:探索虚拟现实中的社交空间

随着科技的不断进步,虚拟现实(VR)技术正成为社交互动和娱乐体验的新前沿。在这个数字时代,Facebook作为全球最大的社交媒体平台之一,正在引领虚拟社交的新时代,其推出的虚拟社交平台Facebook Horizon成为了…

ELF文件内容详解——各节内容分析

文章目录 写在前面准备.text节.data节.strtab.symtab.shstrtab.shstrtab之后 写在前面 只看readelf这个工具说实话我感觉还是有点云里雾里,这里就逐字节分析一下ELF文件中text节(代码段)的内容 本文分析使用的汇编程序ELF文件内容详解这篇文…

Redis之缓存雪崩问题解决方案

文章目录 一、书接上文二、介绍三、解决方案1. 锁2. 不同的过期时间3. 缓存预热和定时任务 一、书接上文 Redis之缓存穿透问题解决方案实践SpringBoot3Docker 二、介绍 缓存雪崩,指大量的缓存失效,大量的请求又同时落在数据库。主要的一种诱因是key设…

【Java面试】MQ(Message Queue)消息队列

目录 一、MQ介绍二、MQ的使用1应用解耦2异步处理3流量削峰4日志处理5消息通讯三、使用 MQ 的缺陷1.系统可用性降低:2.系统复杂性变高3.一致性问题四、常用的 MQActiveMQ:RabbitMQ:RocketMQ:Kafka:五、如何保证MQ的高可用?ActiveMQ:RabbitMQ:RocketMQ:Kafka:六、如何保…

数据湖Iceberg、Hudi和Paimon比较

1.社区发展现状 项目Apache IcebergApache HudiApache Paimon开源时间2018/11/62019/1/172023/3/12LicenseApache-2.0Apache-2.0Apache-2.0Github Watch1481.2k70Github Star5.3k4.9k 1.7k Github Fork1.9k2.3k702Github issue(Open)898481263Github issue(closed)20542410488…

【xss跨站漏洞】xss漏洞利用工具beef的安装

安装环境 阿里云服务器,centos8.2系统,docker docker安装 前提用root用户 安装docker yum install docker 重启docker systemctl restart docker beef安装 安装beef docker pull janes/beef 绑定到3000端口 docker run --rm -p 3000:3000 janes/beef …

小红书x-s算法及补环境 单旋转验证码

前言 大家好呀!新的一年,先祝大家新年快乐咯.祝大家逆向,风控都一把过咯. 新年第一篇文章,后续会持续更新哦! 春晚见证了中国经济的新风口,今年春晚互联网企业赞助商就两家,小红书和京东.小红书类似国外的ins,有预感未来小红书会大火,所以写了这篇文章,有需要的加我,联系方式…

MySQL多实例部署:从概念到实操的全面指南

目录 MySQL多实例管理 单实例 什么是多实例 多实例的好处 多实例的弊端 MySQL多实例用在哪些场景 资金紧张的公司 用户并发访问量不大的业务 大型网站也有用多实例 部署MySQL多实例 rpm和源码的优缺点 二进制方式安装mysql 准备二进制mysql运行所需的环境 准备多…

让 K8s 更简单!8款你不得不知的 AI 工具-Part 2

在 part 1 中,我们探讨了目前比较流行的四种 OpenAI 开源工具。在今天的 part 2 中我们将探究另外三种不同的 OpenAI 开源工具并介绍一些与 Appilot 相关的内容。 Kubectl-GPT Kubectl-GPT 是一个 kubectl 插件,可使用 GPT 模型从自然语言输入生成 kube…

MySQL加锁策略详解

我们主要从三个方面来讨论这个问题: 啥时候加?如何加?什么时候该加什么时候不该加? 1、啥时候加 1.1 显式锁 MySQL 的加锁可以分为显式加锁和隐式加锁,显式加锁我们比较好识别的,因为他往往直接体现在 S…