超强实时人像抠图算法开源,随心所欲背景替换!

谈到人像抠图想必大家都不陌生。在影视剪辑、直播娱乐、线上教学、视频会议等场景中都有人像分割的身影,它可以帮助用户实时、精准地将人物和背景精准识别出来,实现更精细化的人物美颜、背景虚化替换、弹幕穿人等,进一步提升视觉应用体验。

图片

图片

图片

人像抠图的场景可谓无所不在!然而现实中用户使用的终端多种多样,图片的输入组成也是千奇百怪,那么有没有好的方案让能够使用户在多个平台都获得好的体验效果呢?

小编遍历了Github,终于为大家找到了一个高性能且支持多端部署的人像抠图技术的解决方案PP-Seg,它不仅仅提供了多种精度的模型,并针对服务端、移动端、Web端多种使用场景进行了不同的优化,都获得超群的效果。

听了这么多的介绍,大家是不是想尽快尝试一下呢?小编赶紧贴上链接,记得Star收藏一下防止走丢哦:

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.2/contrib/PP-HumanSeg

图片

那么,这个PP-HumanSeg到底提供了什么呢?

小编仔细研究了一下,发现PP-HumanSegl开源了三个高质量的人像分割模型:有应用于服务端GPU部署的PP-HumanSegl模型,有适用于移动端的轻量PP-HumanSeg模型,还有能够在浏览器部署的超轻量模型PP-HumanSegs模型。

同时,为了用户能够在各种平台上部署,提供了服务端部署、移动端、浏览器端的部署方式。

图片

同时小编看到文档上写有“百度视频会议”上线的虚拟背景功能,就是基于PP-HumanSeg中提供的PP-HumanSegs超轻量人像模型来实现的,并且Github上也提供了全套的部署方式。

WOW!也就是说互联网企业使用的虚拟背景整套技术竟然被开源出来了,这也太好了吧!!!!

图片

小编赶紧前去体验了一下,效果真不错,也欢迎感兴趣的小伙伴前去百度首页体验。

看到这么好的技术,有的小伙伴们会比较关注技术上是怎么实现的,那么我们就一起来糠糠吧!

大规模数据合成和数据增强

在训练集里有各种比例的图片,有横屏的,有竖屏的。如果直接直接使用缩放变形等数据增强方式,会直接导致形变失真,反而不会提升精度。针对此类问题,采用维持图像纵横比缩放、Padding补齐等方式缩放图像达到原图比例。通过这些方式处理后图像不会失真,训练精度也得到了提升。

图片

针对人像标注样本少的问题,使用标注信息和背景图合成的方式进行数据生成,数据量的扩充提升了模型的精度。

图片

轻量级网络设计方式

对于移动端和网页端的人像分割,一个高效的轻量级网络必不可少,在这里为大家总结了一些轻量化关键设计方法。

关键一:深度可分离卷积

深度可分离卷积是一种卷积分解方式,将普通卷积分解为Depthwise Convolution和Pointwise Convolution,主要的目的是减少计算量和参数量,此方式已被广泛应用在轻量级卷积网络中。

关键二:Channel Shuffle(通道洗牌)

在深度可分离卷积中用到的Depthwise Convolution会将所有的channel分组,每个channel分为一组,这就导致组与组之间无信息交换。Channel Shuffle通过对group convolution之后的特征图进行“重组”,可以保证接下了采用的group convolution输入来自不同的组,因此信息可以在不同组之间流转。

图片

关键三:Skip-connection(跳跃连接)

对于分割任务,空间域信息非常重要。主流的分割网络均采用encoder-decoder结构。网络的encoder部分通过下采样层把特征图分辨率降得非常小,这一点不利于精确的分割mask生成,通过skip-connection跨层连接编码器和解码器,更利于生成精细的mask。Skip-connection直接复用encoder的特征,几乎不增加计算量,性价比非常之高!

图片

关键四:上采样方法

Decoder的主要目的是将低分辨率信息的特征恢复到高分辨率。为了实现这个目的就需要上采样。常用的上采样方式有四类:转置卷积、反池化、插值、亚像素卷积。

当使用转置卷积进行上采样的时候,容易出现棋盘效应(左图肩膀处)。开发团队为平衡计算量、显存占用和效果,最终采用深度可分离卷积+双线性插值,在保持高效计算的同时解决了棋盘效应问题。

图片

综合考虑上述四个关键,开发团队设计了Web端超轻量级模型PP-HumanSegs。

图片

图片

优化损失函数 解决类别不均衡

人像在整张图片中所占的比例往往较小,存在前景背景类别占比不均衡的问题。常用的Cross Entropy Loss会公平处理正负样本,当出现正样本占比较小时,就会被更多的负样本淹没。通过改变损失函数,使用Lovasz loss来降低正负样本不均衡的问题。

光流后处理优化

视频分割存在一个问题:视频帧间不连贯,边缘部分闪烁严重,为此研发团队利用时序信息结合光流法,对分割结果进行优化。采用光流解决方法,将光流预测结果与分割结果进行融合,这样就可以参考上一帧的运动信息,使得前后帧变换相对更加稳定,减少边缘的闪烁。

图片

图片

心动不如行动,大家可以直接前往Github地址获得完整开源项目代码,记得Star收藏支持一下哦:https://github.com/PaddlePaddle/PaddleSeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/43136.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大家都在用的抠图换背景软件,这些软件你知道几个?

最近跟朋友们出去游玩,拍摄了一些具有纪念意义的照片。但是当我回来挑选照片,准备分享到社交平台的时候,发现有一些照片人像好看,但是背景有点模糊,有的拍不出当时天空的美。难道只能丢弃这些照片了吗?其实…

物品抠图怎么更换背景?快来get这个方法

物品抠图怎么更换背景?相信从事图片编辑,新媒体文案的小伙伴经常会使用到抠图吧。有些图片想要保留物品更换背景的话就需要进行抠图操作,如果手动抠图的话很容易在细节上处理不当,物品的边缘不好把握,抠出来会显得不自…

怎样抠图怎么把背景换成白色?几个步骤教你轻松掌握

有时候我们一些照片背景色比较杂乱需要想要换成纯色,或者一些证件照需要更换白色底该怎么操作呢?相信一些制作简历,或者从事电商图片制作的小伙伴可能都遇到过这种问题,但是很多在线处理的小网页也不敢上传图片怕会泄漏出去&#…

人物抠图换背景怎么做?教你几种抠图方法轻松抠出人物

怎么把图片中的人像抠出来换背景呢?在现代社会,照片已经成为人们生活的常见元素,而照片的后期处理也越来越受到人们的关注。当人们拍摄一张照片时,常常会想要将人像从背景中抠出来,以便更好地突出主题。此时&#xff0…

如何抠图人像换背景?教你一个在线操作的方法

如何抠图人像换背景?抠图是图像处理中常见的一种技术操作,是将一张图片的一部分截取出来作为单独的图层与另外的背景信息进行设计合成。一张没有背景的图片我们可以通过反复用到各种不同场景中,现在电脑上有很多抠图工具,可以充分…

抠图,扣掉背景图片

Remove Image Backgrounds, Free HD, No Signup - Pixian.AI https://pixian.ai/ 从电脑本地选取图片,然后会自动扣掉背景,点击DOWNLOAD就可以了 第一个:Pixian.AI 这是一款国外的在线抠图网站,把需要扣除背景的图片拖拽进来&am…

GPT+金融:和产学研专家碰撞AIGC在金融行业的无限可能

前言 ChatGPT的出现引发了大众对大模型的关注和探索,它展现的强大能力,让其成为近几年最受关注的科技热点。站在金融行业的角度,我们尝试从宏观趋势出发,理解LLM在金融行业为什么会获得高关注度?它在金融行业应该如何…

外包公司“混”了2年,只因我认真做了5件事,如今顺利拿到Vivo Offer

最近有一些读者私信我,说工作贼难找,能不能先去一个软件外包公司先苟着,之后的事情等行情好些了再说。 去外包公司当然没什么不可以,成年人能基于实际做出判断和选择,并承受相应的结果就行。 环境会改变一个人&#…

贾扬清从阿里毕业了!

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来前有QQ空间技术负责人毕业,现在更高级别的技术人贾扬清从阿里毕业了! 贾扬清在朋友圈发文,表示将正式辞任阿里技术副总裁等一系列职位。 贾扬清是谁? 最开始认识大家…

基于数据安全的风险评估-威胁性识别

上篇《基于数据安全的风险评估-脆弱性识别》,是从脆弱性识别内容、识别方式、脆弱性定级,三个部分进行介绍。与脆弱密切相关的是威胁,威胁是一种对组织及资产构成潜在破坏的可能性因素,威胁需要利用资产脆弱性才能产生危害。造成威…

信息安全风险评估

信息安全风险评估 风险评估流程一.评估准备1.1确定评估目标1.2确定评估范围1.3组建评估团队1.4评估工作启动会议1.5系统调研1.6确定评估依据1.7确定评估工具1.8制定评估方案 二.风险要素识别2.1实施流程2.2资产识别2.2.1资产调查2.2.2资产分类2.2.3资产赋值 2.3威胁识别2.3.1威…

百度现场演示AI伙伴,文心一言将支持专属APP,正在加紧内测中

明敏 发自 凹非寺量子位 | 公众号 QbitAI 大模型之争已经演进到离所有人更近的应用层:谷歌决心重构搜索、ChatGPT正式推出APP版。 国内方面的跟进也来了! 而且直接打出一套“组合拳”—— 百度官宣,将用大模型重塑百度的搜索能力,…

百度也要造手机了,小度科技确认发布AI智能手机;iPhone 16 Pro将采用固态按键;Wasmer 3.3发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

Zoho:集成ChatGPT、开发大型语言模型,加紧布局AI+SaaS

在企业的数字化转型进程中,管理层和员工的数字化意识会随着建设的推进而不断提高,对于办公场景的数字化应用需求也不断产生。传统的办公系统建设中,系统的应用能力需要支撑越来越丰富的场景需求。 《今日人工智能》采访到Zoho中国VP兼SaaS事业…

WPS AI最全申请与使用手册;AIGC制作游戏音乐;便宜快捷使用完整版SD;人人都能看懂的ChatGPT原理课 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 面向虚拟世界的生成式AI市场全景图 作者在这篇文章中探讨了生成式AI在虚拟世界的应用,并绘制了 Market Map V3.0 (市场全景…

AI大模型突围战

最近,GPT赛道上争议不断,先是GPT-4的问世,用一些亮眼的功能让人类感叹自己是不是要丢工作?紧接着又有一封联名信刷屏,图灵奖得主、AI三巨头之一的约书亚本吉奥、埃隆马斯克等123个业界大佬,呼吁所有人工智能…

Google内部文件首次泄漏:ChatGPT 没有护城河,开源才是大模型未来

来源:爱范儿 今晨,一篇来自 Google 内部泄漏的文件在 SemiAnalysis 博客传播,声称开源 AI 会击败 Google 与 OpenAI,获得最终的胜利。「我们没有护城河,OpenAI 也没有」的观点,引起了热烈讨论。 据彭博社报…

人与机器全面协同作战的智能时代

前言 ChatGPT全球热浪来袭,无数行业、场景和产品都将面临自我革新,我们已经进入了“人与机器全面协同作战的智能时代”。 自2019年创业以来,雾帜智能始终坚持将人工智能技术精准落地到现实应用场景中;并在网络安全领域&#xff…

掌握AI图像篡改检测工具,轻松识别图片造假

文章目录 一、前言1.1 背景与危害1.2会议探讨1.3 技术先行 二、亮点技术1:AI图像篡改检测技术2.1 传统方法Python实现步骤2.2 合合信息——PS纂改检测体验 三、亮点技术2:生成式图像鉴别3.1 生成式图像安全问题3.2 传统方法Python实现步骤3.2 合合信息—…

使用第三方打码平台图鉴识别滑动验证码模拟登录

文章目录 一.图鉴的账户注册识别流程 二.欧模网案例滑动验证码模拟登录页面分析 三.代码分析四.欧模网案例展示总结 一.图鉴的账户注册 图鉴网页地址: http://www.ttshitu.com/ 登录后充值一个提分 把这个python脚本复制保存到一个python文件中去 识别流程 首先你要先确定验…