老师,不干了,被偷家了,SAM分割任何事物模型,0样本分割了我研究一个月的数据

在这里插入图片描述

文章目录

  • 1. 简明扼要
  • 2. 分割效果
  • 3. 开始探索
    • Segment Anything Model的核心愿景
    • Segment Anything Model已经实现的功能
      • 1.交互式分割
      • 2.全自动分割
    • Segment Anything Model官网
    • Segment Anything Model数据集
    • Segment Anything Model提示性分割
  • 4.文章
  • 5.未来可能

1. 简明扼要

SAM(Segmentation Anything Model)废话少说,出色要点有:

⭐ 建立了迄今为止最大的分割数据集:Segment Anything 1-Billion(SA-1B),1100万张图像,超过10亿个掩码(比任何现有的分割数据集多400倍)
⭐ 和chatgpt的启发思想一样,模型可提示prompt
⭐ 建立了通用的全自动的分割模型,零样本灵活转化新任务新领域,结果甚至优于之前的监督结果

2. 分割效果

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
是!不!是!很!哇!塞!

3. 开始探索

如果整个能量都是激动热闹的,就没有能量被留下来进入思考----我们来开始冷静探索⬇️

Segment Anything Model的核心愿景

减少对于特定任务的专业建模知识要求,减少训练计算需求,减少自己标注掩码的需求.也就是我不咋会,不咋标,不咋训(很环保♻️哈)就把目标分出来

Segment Anything Model已经实现的功能

⭐ SAM已经学会了物体的概念
⭐ 可以为图像或视频中的物体生成掩码,甚至是没遇见过的
⭐ 通用性很强,无论是水下照片还是细胞显微镜

通过官方给的demo,可以测试自己的图像,分为交互式分割全自动分割0成本很方便,例如开头的微信图片,鼠标点击4️⃣次,就提取到了肿瘤区域❗

1.交互式分割

1️⃣登录,accept条款
2️⃣自定义图像分割点击Upload an image 在这里插入图片描述
3️⃣直接在图像上点击想要分割的区域,会出现蓝色小点,代表前景,随着蓝色小点增多,分割的蓝色边缘越小越接近想分割的区域。
4️⃣也可以选择左侧remove area之后继续在图像上点击,会出现粉色小点(我爱粉色),代表背景,用来收缩图像边缘,结合蓝色和粉色小点,图像边缘进行加减法会接近目标区域。
在这里插入图片描述
5️⃣差不多之后点Cut out object,就小功告成啦!
在这里插入图片描述

2.全自动分割

1️⃣登录,accept条款
2️⃣自定义图像分割点击Upload an image
3️⃣点击Everything 就完事啦
他先生成采样点,之后全自动分割,不需要任何点击啦
效果在这里插入图片描述
在这里插入图片描述
可以看到房顶很多形状,一个是正方形,另一个也是😅。但是,但是,但是!有的被分割了,有的没有,真的太好了!模型还有进步的空间(我还有努力的时间😅)
在这里小小的插一嘴,AI取代人的问题,随着社会前进,必将更新,我在浪潮里面,没在浪潮之巅,我能做的仅仅是随机摸索方向,希望顺流而上,这种未知,使人兴奋。自古逢秋悲寂寥,我言秋日胜春朝。脱下孔乙己的长衫的前提是,先穿上。

Segment Anything Model官网

网站地址

官方介绍SAM:
1️⃣ SAM允许用户只需点击一下就可以分割对象,或者通过交互式点击点来包括和排除对象。模型也可以用一个边界框来提示。
2️⃣ 当面临被分割的物体不明确时,SAM可以输出多个有效的掩码,这是解决现实世界中分割问题的重要和必要能力。
3️⃣SAM可以自动找到并屏蔽图像中的所有物体。
4️⃣SAM可以在预先计算图像嵌入后实时生成任何提示的分割掩码,允许与模型进行实时交互

Segment Anything Model数据集

SAM使用数据集进行训练,标注着使用SAM交互式注释图像,反过来更新SAM。属实是闭环成长了。
有了SAM,收集新的分割掩码比以前更快
使用这种方法,通过模型辅助注释者半自动半注释模型全自动分割掩码这三个等级,造就了SAM数据集SA-1B达到1100万张图像,超过10亿个有效的高质量掩码, 比现有的分割数据集多400多倍,比COCO完全手动基于多边形的掩码注释快6.5倍。

在这里插入图片描述
SA-1B数据集不仅能获取的更快 更多 更方便,也 更平均,来自不同国家地区🌏 不同收入🎫
分析模型在人们感知的性别表现、感知的肤色和感知的年龄范围方面的潜在偏差,发现SAM在不同群体中的表现相似

Segment Anything Model提示性分割

受到nlp领域的prompt思想,对新的数据集和任务进行零次和少数次学习,SAM可以使用前景/背景点、一个粗糙的盒子掩码、自由形式的文本,或者,一般来说,任何指示图像中分割内容的信息,都可以当做SAM的prompt

过程:1.图像编码器为图像产生一个一次性嵌入向量 2.轻量级编码器将prompt实时转换为嵌入向量3.结合之后送入轻量级解码器中得到掩码
在这里插入图片描述

4.文章

下载地址

5.未来可能

因为他是启发式模型,可以和用户互动

  • 在AR/VR领域,SAM可以根据用户的目光来选择一个物体,将其提升到3D空间
  • 在创作领域,提取图像区域进行拼贴或视频编辑
  • 在研究领域,通过定位动物或物体来研究和跟踪视频

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21344.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

绝!OpenAI 年底上新,单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力消耗时代

内容一览:继 DALL-E、ChatGPT 之后,OpenAI 再发力,于近日发布 PointE,可以依据文本提示直接生成 3D 点云。 关键词:OpenAI 3D 点云 PointE OpenAI 年底冲业绩,半个多月前发布的 ChatGPT 广大网友还没…

【MIKE水动力】MIKE11基本原理

Mike11软件包由水动力、对流~扩散、水质、降雨~径流、洪水预报等模块组成,核心模块为水动力模块。Mike11水动力模块采用6点Abbott~Ionescu有限差分格式对圣维南方程组求解。 一、圣维南方程组 1、基本要素与假设条件 Mike11模型…

ChatGPT 上线联网和插件功能,Plus 用户下周可使用

OpenAI 宣布将在下周向所有 ChatGPT Plus 用户推出联网和插件功能。OpenAI 表示,位于 Alpha 和 Beta 通道的 ChatGPT Plus 用户都能使用联网功能以及 70 多个已上线的插件。 OpenAI CEO Sam Altman 转发这一推文并表示:"希望你们喜欢"。 此次更…

70多种插件加持,联网版ChatGPT值得拥有

自 ChatGPT 推出以来,大语言模型充斥着新闻版面。很多公司都在试图追赶 OpenAI,但作为先行者,ChatGPT 显得一骑绝尘。 上周六,OpenAI CEO 奥特曼宣布 ChatGPT 的联网和插件功能上线在即,所有买了基于 GPT-4 的 ChatGP…

70多种插件加持,联网版ChatGPT评测来了

来源 | 机器之心 编辑 | 泽南、陈萍 【导读】说不上无所不能,但也可以说是上天入地。 自 ChatGPT 推出以来,大语言模型充斥着新闻版面。很多公司都在试图追赶 OpenAI,但作为先行者,ChatGPT 显得一骑绝尘。 上周六&#xff0c…

Wolfram 接入 GPT点燃了普罗米修斯之火

今天读到了这个新闻,心情非常兴奋、复杂。ChatGPT全宇宙大爆炸!开启联网解除封印,无敌插件彻底颠覆体验 作为一个见证人类技术发展的工程师,我感到非常兴奋。而考虑到我们在基础软件领域全面的短板,在未来的发展中&am…

研究报告 | 把握新变量与新机会,2023年KOL营销七大趋势预测

还记得去年年初有张同学的爆火,有靠着 “毽子操”刷新抖音平台涨粉最快纪录的刘畊宏;年中,我们与东方甄选双向奔赴,感受从诗词歌赋到人生哲学的直播间魅力;紧接着,“消失”109天的李佳琦低调回归&#xff0…

OpenAI官方的AutoGPT要来了!实测效果很优秀

点击上方“Java基基”,选择“设为星标” 做积极的人,而不是积极废人! 每天 14:00 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应…

成功转行Python工程师,年薪30W+,经验总结都在这!

这是给转行做Python的小白的参考,无论是从零开始,或者是转行的朋友来说,这都是值得一看的,也是可以作为一种借鉴。 而且我决定转行IT(互联网)行业(已转好几年),其实理由…

完全免费白嫖 GPT-4 的终极方案!

GPT-4 目前是世界上最强的多模态大模型,能力甩 GPT-3.5 好几条街。 大家都希望早日用上 GPT-4,不过目前体验 GPT-4 的渠道非常有限,要么就是开通 ChatGPT 尊贵的 Plus 会员,即使你开了会员,也是有限制的,每…

玩“爬虫”可能触犯的三宗罪

最近网上流传一个顺口溜:爬虫玩得好,监狱进得早。数据玩得溜,牢饭吃个够。 自2019年9月以来,多家知名公司相关人员被抓或被调查,这些机构均涉及大数据风控业务和爬虫技术的应用。由此,大数据业务的合规合法…

偷偷曝光下国内软件外包公司!(2023 最新版,很全!)

点击关注公众号,Java干货及时送达 推荐阅读: 学习 Spring Cloud 微服务的正确姿势! 用上 ChatGPT 啦,强的离谱! 欢迎大家加入《ChatGPT 小密圈》知识星球,现在加入,免费送一个手工注册的 ChatGP…

孙子漏洞!ChatGPT又百依百顺了;程序员的LLM世界生存技巧;UI+MJ入门必读手册;吴恩达LangChain实践课 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 继「奶奶漏洞」之后再现「孙子漏洞」,装成孩子让 ChatGPT 千依百顺 前几天,网友发现了 ChatGPT 的新鲜玩法&am…

使用Python实现微信自动回复,操作简单,小白也会使用!秒回女朋友消息 泰裤辣!

文章目录 一、安装itchat库二、登录微信三、实现自动回复四、实现关键词回复五、实现图灵机器人回复总结 Python精品助学大礼包 一、安装itchat库 首先,我们需要安装itchat库,它是一个用于微信个人号的微信Python API,可以用于实现微信自动回…

超火的chartGPT到底是什么?没有账号我能使用吗

什么是OpenAI? OpenAl是一家人工智能研究公司,成立于2015年,总部位于美国加利福尼亚州旧金山。公司的目标是建立一种通用人工智能技术,并将其让普通人能够轻松使用。OpenAl的研究领域包括机器学习、自然语言处理和强化学习等。其中,GPT-3是OpenAl开发的一种大型语言…

ChatGPT外挂,Link Reader 快速阅读网页、PDF内容还能翻译

在现今什么都讲求快速的时代里,很多人都没有耐心一字一句阅读落落长的文章了,所以今天我们就要跟大家分享一个好用的ChatGPT Plugins 外挂,可以帮你阅读网站的内容,并且告诉你文章到底在讲什么。 先要拥有 ChatGPT Plus 帐号&…

史上最小 x86 Linux 模拟器「GitHub 热点速览 v.22.50」

作者:HelloGitHub-小鱼干 本周 GitHub Trending 略显冷清,大概是国内的人们开始在养病,而国外的人们开始过圣诞、元旦双节。热度不减的 ChatGPT 依旧占据了本周大半的 GitHub 热点项目,不过本周的特推和周榜并未重复收录这些。不过…

德勤:2023技术趋势报告(附下载链接)

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年1月份热门报告盘点 罗振宇2023年跨年演讲PPT原稿 吴晓波2022年年终秀演讲PPT原稿 《底层逻辑》高清配图 华为2021数字化转型:从战略到执行.pdf华为项目管理…

图解NLP模型发展:从RNN到Transformer

图解NLP模型发展:从RNN到Transformer 自然语言处理 (NLP) 是深度学习中一个颇具挑战的问题,与图像识别和计算机视觉问题不同,自然语言本身没有良好的向量或矩阵结构,且原始单词的含义也不像像素值那么确定和容易表示。一般我们需…

一图看懂 openai 模块:ChatGPT的API python库, 资料整理+笔记(大全)

本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 一图看懂 openai 模块:ChatGPT的API python库, 资料整理笔记(大全) 摘要模块图类关系图结束 摘要 全文介绍系统内置 openai ——ChatGPT的API pyt…