segment anything

【唐宇迪】CV不存在?Meta最新的计算机视觉Segment Anything Meta终极模型,强到离谱!-人工智能/计算机视觉/深度学习/机器学习_哔哩哔哩_bilibili4月5日最新发布,Meta正式推出模型SAM(Segment Anything Model)称这一模型可用于识别图像和视频中的物体,甚至是从未被训练学习过的物品。技术论文也一并推出,标题甚至只有两个单词——Segment Anything(分割一切),喜欢记得多多支持。, 视频播放量 15478、弹幕量 142、点赞数 447、投硬币枚数 239、收藏人数 1044、转发人数 139, 视频作者 跟着唐宇迪学AI, 作者简介 全网同名!大家好,我是唐宇迪,一名计算机博士,专注于机器学习与计算机视觉领域。感谢关注~~~,相关视频:CV界不存在了?体验下Meta最新的Segment Anything Meta计算机新模型实现“终极抠图”,segment-anything是趋势,但是牛逼吹的太大了,【AI绘画】破解Diffusion扩散模型,[小白向-深度学习装机指南] 01 双4090 涡轮版开箱启动 vlog(gpu burn,cpu burn),Segment Anything上线一天8.2k star,Segment Anything 图像分割 VS 清明上河图,计算机视觉(CV)方向就业情况分析,听说很卷?,我大抵是难毕业了,效果巨烂。Yolov5+deepsort+1DCNN,任正非谈ChatGPT,ChatGPT结合Python和MATLAB科研绘图,王炸。https://www.bilibili.com/video/BV18T411W7ph/?spm_id_from=333.337.search-card.all.click&vd_source=4aed82e35f26bb600bc5b46e65e25c22Segment Anything | Meta AIhttps://segment-anything.com/demo

Segment Anything(sam)项目整理汇总[2023.7.15] - 知乎0.背景sam是一个无监督的分割图像的基础模型,分割效果非常好,具体细节可看论文解读。 https://zhuanlan.zhihu.com/p/620355474自从sam模型发布以来,基于sam的二次应用及衍生项目越来越多,将其应用于各种任务,…https://zhuanlan.zhihu.com/p/630529550sam后续也出了很多工作:

segment-anything:

clicks:点,box:框,everything:全图画点。

abstract:数据闭环,1100万张图,10亿mask。可以在一些新的数据分布和任务中直接zero-shot。

1.introduction

        foundation models没在数据分布上训练也可以泛化,借助于prompt。本文的核心是构建了一个数据引擎,task,model,dataset。

task:给定prompt输出,prompt可以是文本或者空间上点,只要可以编码成向量就可以,点和框的坐标编码成向量。存在歧义涉及多个对象,输出也是这些对象中至少一个合理的mask。

model:image encoder(VIT),prompt encoder(任意的prompt,point,box,mask prompt一堆点,text prompt),mask decoder,从一个prompt中进行解码只需要50ms进行交互。

data engine:assisted-manual,semi-automatic,fully automatic。

dataset:1100万张图,10亿mask。

标注数据示例:

2.segment anything task

pre-training:vit->mae,text->clip.

3.segment anything model

Image encoder:MAE,ViT-H/16 with 14x14 windowed,16倍下采样,1024x1024降采样成64x64。

Prompt encoder:sparse points,boxes,text and dense masks。点和框通过positional encodings,text通过clip,masks使用卷积嵌入并与图像embeddings相加。变成256维向量。

mask decoder:mask decoder通过image embeddings,prompt embeddings,将oputput token映射到mask,修改了transformer decoder block,我们修改的decoder使用了prompt self-attention和cross-attention,其实就是在vit编码后的image embeddings中,使用通过编码后的embeddings去检索,最终得到mask。

self-attention是prompt之间的attention,明确各自要找的目标,cross-attention是每个token去image embeddings中去检索自己对应的区域。image embedding是256x64x64,token和image存在相互更新。2个decoder,第一个decoder是在64x64上,第二个decoder做了上采样4,是在256x256上做,prompt在第二个decoder时也加了position encoding。

efficiency:cpu上50ms。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12606.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023年的深度学习入门指南(6) - 在你的电脑上运行大模型

2023年的深度学习入门指南(6) - 在你的电脑上运行大模型 上一篇我们介绍了大模型的基础,自注意力机制以及其实现Transformer模块。因为Transformer被PyTorch和TensorFlow等框架所支持,所以我们只要能够配置好框架的GPU或者其他加速硬件的支持&#xff0…

用Chatgpt超级写手批量制作爆款内容霸屏 (01)

有成交需要有转化, 有转化需要有流量, 有流量需要有内容, 好的内容,又是流量和转化的关键。 Chatgpt内容工厂将以好内容为载体, 通过Chatgpt超级写手, 来自动化批量生产好的内容。 什么样的内容是好的内容&…

全自动,真批量——Chatgpt超级写手机器人1.0

Part1用chatgpt写作时常常遇到以下问题: 01.写了一段,没写完就停了 02.停了之后,你发继续写,上下文衔接不上来,甚至毫不相干 03.提问和和回答都需要手动复制粘贴 04.提问次数多了,整理提问回答很麻烦 05.提…

.ART艺术域名遇上 ChatGPT:在线展示您的艺术作品的创新方式

前言 .ART 艺术域名一直走在创新的前沿,不断为创意社区带来技术上的创新和支持。近日,.ART 通过深入人工智能领域,与著名的 ChatGPT 合作以保持在艺术科技行业的领先地位,并为用户提供尖端解决方案。 视觉艺术家 Daniel Arsham 最…

使用railway部署Node项目及遇到的问题

大家好, 今天愚人节, 祝大家节日快乐~ 同时向大家推荐一个非常nice的网站, railway, 它能够免费部署项目, 并且免费的账号. 一个月有20天使用权限, 如果想要更长的时间, 就需要续费, 但是一个月20天免费, 还是非常的划算的. 大家都可以去试试, 并且还有一个好处, 它的域名是…

前端性能优化(提升13倍)

1、背景 有好几个童鞋跟我反馈,你测试平台在线demo加载好慢啊 慢确实是慢,但这事情不能赖我呀,肯定是腾讯云的锅。 腾讯云8m带宽的服务器,可是我斥巨资购入的呀 这可是价值5040元的服务器啊!(虽然实付只…

(亲试有效)如何完美更换WordPress网站的域名

前几天,一位WordPress王牌主机的用户问我,他的WordPress网站已经建立一年多了,现在想要修改网站使用的域名,该如何操作?这是WordPress用户经常遇到的问题。今天我们来给大家介绍一下,如何更换WordPress网站…

ChatGPT 如何用?12个场景的 Prompts 万能话术模板 四个提问技巧

“AI 不会取代人,只会淘汰不会使用AI的人。” 01 — 昨天的《AI启航实用变现手册》发出去后,有朋友问怎么用 ChatGPT 解决我的问题呢?遇到的场景是这样的:‍‍‍‍‍‍‍‍‍‍ “教育机构,老学员8月份续费活动都有哪些…

ChatGPT Plus停售!地球已经没有足够的算力来满足需求了

杨净 发自 凹非寺量子位 | 公众号 QbitAI 刚续费不到2周的账号,现在登录不上了去了。了解一圈后发现,GPT Plus都停售了,GPT 4.0 太消耗算力,不知道是真是假,或另有隐情! 网络上众说风云,比如&am…

8个升级到ChatGPT Plus的理由,不升级你就out了

​关注文章下方公众号,可免费获取AIGC最新学习资料 导读:ChatGPT Plus 是 OpenAI 聊天机器人的高级付费版本。以每月 20 美元的价格,该服务为您提供访问 GPT-4,您可以享有令人难以置信的稳定性和更快的响应时间。 本文字数&#…

ChatGPT与Claude对比分析

一 简介 1、ChatGPT: 访问地址:https://chat.openai.com/ 由OpenAI研发,2022年11月发布。基于 transformer 结构的大规模语言模型,包含1750亿参数。训练数据集主要是网页文本,聚焦于流畅的对话交互。对话风格友好,回复通顺灵活,富有创造性。存在一定的安全性问题,可…

小提琴 吉他 二胡 钢琴曲谱智能应用开发 五线谱 六线谱 四线谱简谱播放识别SDK

智域智联科技致力于用“智能化教学 音乐软件模块”及“在线教育AiScore 平台”赋能传统音乐教育,使音乐教 育机构智能化教育转型成为可能。 AifbdScore是一个跨平台的声音识别和评 测库,运用人工智能深度学习算法采集各 种乐器不同音高的时域、频域特征训…

【收集】键盘钢琴 和弦琴谱 (带HTML版开发流程)

目录 键盘钢琴开发 《御剑江湖》 《星之所在》 《童话》 《一直很安静》 《雨的印记》 《天空之城》 《苍海一声笑》 《卡农》 《Tifa Theme》(under construction) 键盘钢琴开发 烦闷中,何以解忧?听君一曲,莫问秋…… 顺着找到的V…

基于 Python 的音乐流派分类

音乐就像一面镜子,它可以告诉人们很多关于你是谁,你关心什么,不管你喜欢与否。我们喜欢说“you are what you stream” - Spotify Spotify 拥有 260 亿美元的净资产,是如今很受欢迎的音乐流媒体平台。它目前在其数据库中拥有数百万…

语谱图(二) Spectrogram 的产生

1. 信号预处理部分 预处理部分中 包括 预加重分帧加窗 ; 1.1 读取音频数据 python可以用librosa库来读取音频文件,但是对于MP3文件,它会自动调用audio_read函数,所以如果是MP3文件,务必保证将ffmpeg.exe的路径添加…

一网打尽,音乐高手都在使用的打谱软件不藏私推荐

一网打尽,音乐高手都在使用的打谱软件不藏私推荐 关键词:打谱软件,Guitar Pro,Overture,Sibelius,Finale Guitar Pro:sourl.cn/KsuXZz Overture:sourl.cn/VsYZ3y Sibelius:sourl.cn/2fyfZt 学音乐的大家都知道&am…

WaveTone 2.67原创汉化版扒谱辅助教程

深度解析音频结构 精准扒谱,扒和弦分析! WaveTone 是音频后期制作,深度学习编曲的好助手! 汉化版支持中英文自由切换,重启应用程序生效! 支持导出主流音频Wav格式和MIDI键盘记录文件!可以在…

【Musescore 】开源打谱软件 快速入门笔记

前两天做了个西贝柳斯的打谱软件学习笔记,反正都是初学,今天再来学习一款同类软件,比较之后确定一款深入学习。 西贝柳斯的学习笔记在此:https://blog.csdn.net/yuetaope/article/details/120020342 西贝柳斯是商业收费软件&#…

Guitar Pro8.1专业版新功能简谱介绍

Guitarpro 8.1版本中,已成功推出全新的简谱功能!Guitar Pro是一款非常流行的音乐制谱软件,它支持各种乐器的制谱。在思杰马克丁引入这款软件之后,为它专门定制了中文版,并针对中国用户重新定价。GuitarPro经过5年研发&…

吉他谱软件guitar pro2023吉他和弦、六线谱、BASS四线谱绘制

Guitar Pro由法国Arobas Music出品,主要用于管弦乐器的学习,通过建立不同的音轨,可完成不同乐器乐谱的编排制作。Guitar Pro发布23余年来,其强大的功能被广泛应用于专业乐队的创作和排练,其独创的gtp文档格式在专业领域…