【达摩院OpenVI】老片图像上色,一键开源体验

  团队模型、论文、博文、直播合集,点击此处浏览

一、背景        

        图像上色(Image Colorization)顾名思义,是指对黑白图像添加色彩,使其变成彩色图像。更具体的说,我们常见的彩色图像通常是三通道图像,而黑白图像只有一个灰度通道,因此,图像上色旨在利用单一灰度通道恢复图像的两个彩色通道。随着摄影技术的演进,彩色照片在现在已经非常普及,但仍然有大量历史黑白照片遗留。图像上色可以对这些宝贵的旧时代遗产进行修复,令老照片重获新生。
        我们使用真实历史黑白老照片作为输入,经过上色模型处理,最终可以得到观感惊艳的彩色照片!

原图来自:1945.“Abandoned boy holding a stuffed toy animal.”


二、方法 

        早期图像上色通常依赖手工或基于参考图的方法,随着深度学习的普及,越来越多工作使用卷积神经网络完成图像上色任务。
        发表在 ECCV 2016 的 CIC 模型将上色视为一个分类问题,使用一个纯卷积神经网络进行上色,从此揭开了卷积神经网络在上色领域应用的序幕。

图片来自CIC
图片来自CIC


        后来,为了提高上色结果的语义贴合度和色彩鲜艳度,有一些方法使用 UNet 或 GAN 网络完成上色。ChromaGAN 使用一个编码器-解码器网络完成图像重建,并将 GAN 损失引入上色过程。ToVivid 模型通过利用预训练 GAN 的丰富生成先验,实现生成合理和丰富多彩的结果。

图片来自ChromaGAN
图片来自Tovivid


        近两年,随着 Transformer 模型在视觉领域大放异彩,众多基于视觉 Transformer 的上色模型逐一涌现,这些模型充分利用了 Transformer 的强大建模能力和全局注意力优势,因而实现了更加惊艳的上色效果。Google 提出的 ColTran 模型使用三个独立的子网络分别实现粗上色、颜色上采样和空间上采样。ColorFormer 则创新的提出 GLH-Transformer 来更好的提取图像特征,并结合 Color Memory 辅助完成彩色解码。

图片来自ColTran
图片来自ColorFormer

        接下来,本文针对一个最近基于 Transformer 的上色模型 DDColor 进行展开介绍,带读者了解上色领域的前沿技术。DDColor 模型的整体结构如下:


可以看到,DDColor 模型包括一个图像编码器和两个解码器,分别是图像解码器和颜色解码器。图像解码器完成视觉特征的上采样过程,而颜色解码器基于一个 Transformer 进行颜色查询的解码。
具体而言,颜色解码器使用多尺度的视觉特征帮助颜色嵌入的学习,因此学习到强语义相关的颜色嵌入。

图片来自颜色解码器


同时,论文还提出一个色度损失,帮助提升生成结果的色彩鲜艳度。


        模型使用 ImageNet 数据集进行训练,ImageNet数据集是一个大型计算机视觉数据集,包合 1400 多万张图片。ImageNet 数据集一直是评估图像上色算法性能的基准。DDColor 利用 ImageNet 训练集训练而成。


三、体验

1. 运行依赖安装
方式一:如果有本地或云服务器计算资源,可以在本地进行环境安装,以更灵活的方式体验算法模型。

方式二:如果觉得本地安装较为复杂,也可以在线运行 ModelScope 平台提供的 Notebook。Notebook 中预先安装了官方镜像,因此无需再进行手动环境安装,更加方便快捷。(打开链接:ModelScope 魔搭社区,点击右上角“快速体验”)

2. 图像准备
准备一张黑白图像或者彩色图像(输入一张彩色图像,也可以进行重上色),图像可以在本地或网络上,记录下图像的地址,例如我们选取这张奥黛丽赫本的经典黑白照片:
https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/audrey_hepburn.jpg


3. 调用 pipeline 进行图像上色

import cv2
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasksimg_colorization = pipeline(Tasks.image_colorization, model='damo/cv_ddcolor_image-colorization')
img_path = 'https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/audrey_hepburn.jpg'
result = img_colorization(img_path)
cv2.imwrite('result.png', result[OutputKeys.OUTPUT_IMG])

这样,我们就获得了一张上色后的彩色图像(result.png),效果还不错!🍻



4. 更多玩法
        图像上色是视觉增强的一个子问题,然而,对于视觉增强这个领域,还有很多有趣的算法和应用。在ModelScope 社区,目前已经上线了包括去噪、超分、调色、插帧等在内的多种视觉增强算法。对于低质量的原始视频或图像,经过增强修复处理后都能变得焕然一新,得到极致高清、饱满、丝滑的体验。点击链接ModelScope 魔搭社区 可体验多种视觉增强编辑功能。


四、参考


Richard Zhang, Phillip Isola, and Alexei A Efros. Colorful image colorization. In European conference on computer vision, pages 649–666. Springer, 2016.
Vitoria P, Raad L, Ballester C. Chromagan: Adversarial picture colorization with semantic class distribution[C]//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. 2020: 2445-2454.
Yanze Wu, Xintao Wang, Yu Li, Honglun Zhang, Xun Zhao, and Ying Shan. Towards vivid and diverse image colorization with generative color prior. In Proceedings of the IEEE/CVF International Conference on Computer Vision, 2021.
Manoj Kumar, Dirk Weissenborn, and Nal Kalchbrenner. Colorization transformer. In International Conference on Learning Representations, 2021.
Ji Xiaozhong, Boyuan Jiang, Luo Donghao, Tao Guangpin, Chu Wenqing, Xie Zhifeng, Wang Chengjie, and Tai Ying. Colorformer: Image colorization via color memory assisted hybrid-attention transformer. In European Conference on Computer Vision (ECCV), 2022.
Kang X, Yang T, Ouyang W, et al. DDColor: Towards Photo-Realistic and Semantic-Aware Image Colorization via Dual Decoders[J]. arXiv preprint arXiv:2212.11613, 2022.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/66323.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【达摩院OpenVI】开源体验AI云台,去视频抖动

团队模型、论文、博文、直播合集,点击此处浏览 一、背景 随着自媒体与短视频的兴起,人们有了越来越多的拍摄视频的需求。然而由于手持拍摄、硬件限制等原因,利用手机等普通摄影设备拍摄的视频难免存在视频抖动问题。尤其是开启较高倍数的变焦…

如何发现异常商业数据?达摩院用这套算法

简介: 作者 | 宋晓旻 ​小叽导读:本文将集中分享阿里巴巴达摩院机器智能技术时序智能组与阿里数据团队合作成果——异常数据检测技术的演进和商业数据端的应用展示。文中提到的技术由阿里巴巴达摩院决策智能团队开发,本文由达摩院算法专家宋晓…

【达摩院OpenVI】几行代码,尽享丝滑视频观感

团队模型、论文、博文、直播合集,点击此处浏览 随着网络电视、手机等新媒体领域的快速发展,用户对于观看视频质量的要求也越来越高。当前市面上所广为传播的视频帧率大多仍然处于20~30fps,已经无法满足用户对于高清、流畅的体验追…

马云爸爸成立快一年的达摩院,究竟在做什么?

去年10月份,“马云爸爸”做了一件非常惊人的事——成立阿里巴巴达摩院。 阿里之下的达摩院,来源于武侠小说,作为武学最高研究机构,达摩院代表了修为的最高境界。同样,科研也代表了精进、执着和专注的精神。 达摩院成…

计算机如何“看懂”图片?达摩院提出新的研究方法

简介: 本文的部分内容基于英文论文"Learning in the frequency domain"翻译而来,英文论文已经被计算机视觉顶级会议Computer Vision and Pattern Recognition (CVPR) 2020接收。该论文的公开链接为:https://arxiv.org/abs/…

深度解密阿里达摩院:如何让科技与商业共舞

恐怕再没有一个科研机构被赋予这么诗意的名字,达摩院。 它来源于武侠小说,作为武学最高研究机构,达摩院代表了修为的最高境界。同样,科研也需要精进、执着和专注的精神。 或许是源于对武学的痴迷,2017年10月,阿里巴巴董事局主席马云将新成立的阿里研究院命名为“达摩院…

阿里成立达摩院,三年投入超千亿

马云表示:“阿里巴巴前十年最重要的命题是活下去,内部绝对不提成立研究院。” 阿里巴巴今年18岁了,到了成立研究院的时候了。 今天上午,在2017杭州云栖大会上,阿里巴巴CTO张建锋宣布,阿里巴巴成立全球研究…

阿里达摩院发布并开源“通义”大模型,AI底座之上促场景创新

2022 WAIC带上,达摩院发布并开源“通义”大模型,在国内率先构建了AI统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。 9月2日,阿里巴巴达摩院主办世界人工智能大会“大规模预训练模型”主题论坛。会上,达…

认识一下阿里的AI殿堂-达摩院

国内三大科技领头羊BAT,BT我们已经介绍过,今天随我一起揭开阿里巴巴技术背后的神秘面纱。 1 达摩院的诞生 1.1 冠名与成立 2017年10月11日,第八届云栖大会在杭州拉开了帷幕,这次大会上,马云重磅宣布成立了阿里巴巴全球研究院,取名为达摩院(DAMO),并计划3年内,对达…

图解阿里达摩院内部结构

文章来源:ATYUN AI平台 达摩院结构图 阿里达摩院5大研究领域——机器智能、数据计算、机器人、金融科技、X实验室,旗下共设14个实验室。 ——一.机器智能领域: 1.包括:语音实验室,视觉智能实验室,语言技…

达摩院的地球云计算平台AI Earth使用体验

缘起 这几天朋友圈被AI earth刷屏了,阿里达摩院推出了基于AI与云计算的地球科学计算平台AI earth。周五我便注册了账号,周六通过了审核。我开始尝试使用AI earth。 使用初体验 首先登录AI earth的官网(https://engine-aiearth.aliyun.com/…

达摩院快速动作识别TPS ECCV论文深入解读

团队模型、论文、博文、直播合集,点击此处浏览 一、论文&代码 论文:Spatiotemporal Self-attention Modeling with Temporal Patch Shift for Action Recognition 模型&代码:https://modelscope.cn/models/damo/cv_pathshift_acti…

Python动物图像分割API简单调用实例演示,阿里达摩院视觉智能开放平台使用步骤

阿里云视觉智能开放平台 - 动物分割 效果图演示平台入口创建获取密钥本地图片转 URL 与密钥测试代码调用演示语义分割知识拓展阿里云达摩院智能视觉开放平台 效果图演示 调用本地图片处理后可以直接保存到本地,右边就是分割好的效果图,可以看到分割的效…

在本地机房享受专属公共云服务,详解阿里云本地化部署服务云盒

6月30日,阿里云宣布本地化部署服务阿里云云盒Cloud Box正式上线。从即日起,用户通过阿里云官网下单即可购买。 各行业上云已成趋势,随着大数据、人工智能、物联网、5G 等技术的快速发展,大部分公司将数字化转型列为企业的优先战略…

【洞见观点】金融领域隐私计算平台间的互联互通技术实践与研究

目录 互联互通的定义 互联互通的原则 互联互通演进史 第一阶段:业务驱动不同厂商的隐私计算平台一对一对接 第二阶段:厂商自定义自己的互通规范 第三阶段:形成行业统一的标准规范 互联互通的实现路径 第一层次:管理系统互通 1)节点发现 2)资源…

港科资讯 | 香港科技大学经济学博士2023招生夏令营

为了让有志于在经济学领域继续深造的学生与我们的师生互动,感受科大校园的学习、研究和生活环境,香港科技大学(科大)商学院经济学博士项目将于今夏举办为期两天的招生夏令营,我们欢迎广大优秀学子踊跃申请。 优秀的参与…

教授专栏37 | 黄昊: 发展虚拟资产, 须监管教育并行

文 / 黄昊教授 全球第二大虚拟货币交易所FTX早前 「爆煲」 申请破产,其创办人兼行政总裁SamBankman-Fried (SBF) 辞任行政总裁。FTX于2019年成立后,先后共获10多亿美元融资,当中不乏知名机构,包括红杉资本、软银、淡马锡及贝莱德等…

FinTech活动 | “金融科技创新应用与发展”研讨会25日在金融街举办

8月25日,由北京金融街服务局、国家金融与发展实验室金融科技研究中心主办,金融科技50人论坛、神州信息协办,中国人民大学国家发展与战略研究院、中国人民大学国际货币研究所、浙江大学互联网金融研究院、中关村互联网金融研究院、深圳市金融科…

香港科技大学有什么好的专业?

香港科技大学创办于1991年10月,是一所坐落于香港清水湾半岛的公立研究型大学。大学设有4个学院:工学院、理学院、人文社会科学学院和工商管理学院,还设有2个研究院:香港科技大学公共政策和行政研究生院和香港科技大学霍英东研究院…

达观数据荣获长三角金融科技研究院和《金融电子化》2021中国金融科技领军企业

近日,由长三角金融科技研究院和《金融电子化》杂志社联合主办的“2022金融科技创新与应用外滩高峰论坛暨第二届长三角金融科技创新与应用全球大赛总决赛”中,达观数据凭借数字化信贷办公机器人项目在此次比赛中脱颖而出,荣获“2021中国金融科…