如何区分人工智能生成的图像与真实照片(上)

       随着最先进扩散模型(如Midjourney、Stable Diffusion和Firefly)生成的图像具有高度的逼真度,未经训练的我们很难区分真实照片和AI生成的图像。为了解决这个问题,份指南,帮助读者培养更批判的眼光,识别AI生成图像中经常出现的人工痕迹、不一致性和不可信之处。

       根据AI生成图像中出现的人工痕迹和不合理性的五个高级类别组织了这份2024年的指南:解剖学上的不合理性、风格上的人工痕迹、功能性上的不合理性、违反物理规律和社会文化上的不合理性。然而,并非总是能够轻易地识别图像中的人工痕迹和不合理性,尤其是在肖像图像中。同样,真实的照片有时也会包含看起来不合理或像视觉人工痕迹的元素。本指南的目标是帮助你培养对视觉不一致性的敏锐眼光,并校准你对图像是否由AI生成、真实或太模糊而无法在没有进一步信息的情况下知道的直觉。

      可以在阅读前,先测试一下自己的技能,测试网址如下:

DeepFakes, Can You Spot Them?

     你可以挑出下列图中哪两张是真实照片吗?仔细看看(答案在最后)

1 背景

1.1 AI 图像生成技术发展

  • 从 GAN 到扩散模型:AI 图像生成技术经历了从 GAN 到扩散模型的演变。GAN 是最早用于生成逼真图像的模型,但扩散模型在 2024 年成为主流,能够生成更具表现力和可控性的图像。
  • 扩散模型的工作原理:通过向图像添加噪声并学习逐步去除噪声来生成图像。例如 Midjourney、Stable Diffusion 和 Firefly 等平台都使用扩散模型。

1.2 AI 图像的识别难度

  • 高度逼真:AI 生成的图像可以达到高度逼真的程度,即使是未经训练的人类也难以区分真实照片和 AI 图像。
  • 人工痕迹:尽管 AI 图像非常逼真,但它们往往存在一些人工痕迹,例如人体不合理之处、风格痕迹、功能不合理之处、违反物理原理和社会文化不合理之处。

1.3 影响识别难度的因素

  • 姿势复杂度:姿势复杂的图像更容易出现人工痕迹。
  • 背景细节:背景细节丰富的图像更容易识别,而背景模糊的图像则更难识别。
  • 人数:人数较多的图像更容易出现人工痕迹,因为模型难以处理复杂的人物关系。
  • 面部大小:面部较小的图像更容易出现人工痕迹,因为细节更难识别。
  • 图像分辨率:低分辨率图像更难识别,因为信息量更少。

1.4 指南结构和目标

  • 五个类别:指南将人工痕迹和不合理之处分为五个类别:人体不合理之处、风格痕迹、功能不合理之处、违反物理原理和社会文化不合理之处。
  • 目标:帮助读者发展更敏锐的视觉洞察力,并培养判断图像是否为 AI 生成的直觉。

2 人体不合理之处

人体不合理之处是 AI 生成的图像中常见的特征之一,它们通常出现在手部、眼睛、牙齿、身体、身体合并和生物识别特征等方面。

2.1 手部

手指缺失/多余:AI 生成的图像中,人物的手指可能缺失、多余或合并,导致手部看起来不自然。

指甲缺失:人物的手指甲可能缺失,使其看起来不完整。

手部比例不合理:手部可能过大或过小,与身体比例不协调。

2.2 眼睛

瞳孔对齐不当:瞳孔可能对齐不当,导致眼睛看起来不自然。

瞳孔形状不圆:瞳孔可能呈现不规则形状,而不是圆形。

眼睛过于光亮:眼睛可能过于光亮,缺乏自然的光泽和细节。

空洞的眼神:人物的眼神可能空洞无神,缺乏情感表达。

2.3 牙齿

牙齿排列不齐:牙齿可能排列不齐,甚至重叠,导致口腔看起来不自然。

牙齿数量异常:人物可能拥有过多或过少的牙齿,与正常情况不符。

2.4 身体

多余/缺失肢体:人物可能拥有多余或缺失的肢体,导致身体结构不合理。

身体弯曲方式不合理:身体部分可能以不自然的方式弯曲,例如膝盖反方向弯曲。

身体比例不合理:身体比例可能不协调,例如头过大或过小。

2.5 身体合并

身体部位合并:AI 模型可能无法区分不同人物的身体部位,导致身体部位合并,例如手指或脚趾合并。

2.6 生物识别特征

面部特征差异:与真实照片相比,AI 生成的图像中人物的面部特征(例如耳朵、鼻子、嘴巴的大小、形状和比例)可能存在差异。

2.7 识别人体不合理之处的要点

  • 手部是否有任何人工痕迹?
  • 人物的四肢比例是否不自然?
  • 不同人之间是否有身体部位合并?
  • 任何人的目光看起来不自然吗?
  • 眼睛或嘴巴/牙齿有什么不自然的地方吗?
  • 图像是否似乎描绘了一个你有其他图像的人?如果是,与其他图像相比,生物特征的大小、形状和比例是否有明显差异?

3 风格上的人工痕迹

       风格上的人工痕迹是指AI生成图像中,与真实照片相比,在风格上出现的明显或不明显的人工痕迹。这些痕迹可能源于AI对图像细节的过度优化或缺乏对真实世界逻辑的理解,从而导致图像看起来过于“完美”或不符合现实世界的规律。

3.1 常见风格痕迹

  • 塑料质感:人物的皮肤可能看起来蜡质、反光、卡通化或过于光滑,缺乏真实皮肤的自然纹理和光影变化。
  • 电影化风格:图像可能呈现出戏剧化、戏剧性的氛围,类似于电影或杂志照片,缺乏真实场景的自然感。
  • 超现实细节:某些部分的细节可能过于精细,例如头发看起来过于柔软、细腻且被风吹拂,与场景中的其他元素不协调。
  • 分辨率和颜色不一致:图像中不同部分的分辨率或颜色可能不一致,例如人物和背景之间,或不同物体之间,看起来像是从不同场景拼接而成。
  • 缺失背景或背景不自然:图像可能缺少背景,或背景看起来不真实,例如绿幕背景或被照片编辑工具篡改的痕迹。
  • 光线和阴影问题:阴影可能投射方向不一致,或形状与光源不符。
  • 反射问题:镜面、水面或其他光滑表面上的反射可能与场景中的其他元素不匹配。
  • 深度和透视问题:图像可能出现扭曲,或深度和透视关系不符合现实世界的规律。

3.2 识别风格上的人工痕迹的要点

  • 图像中的人物看起来是否蜡质、光滑、闪亮或塑料感?
  • 场景是否看起来不自然地戏剧化和电影化?
  • 是否有缺失的背景或不自然的背景?
  • 图像的不同部分是否看起来像是从不同的场景中剪切出来的?
  • 脸部是否看起来与图像的其余部分处于不同的照明下?
  • 图像中不同组件的边缘是否有类似涂抹的故障?

答案如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/350783.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue-loader

Vue Loader 是一个 webpack 的 loader,它允许你以一种名为单文件组件 (SFCs)的格式撰写 Vue 组件 起步 安装 npm install vue --save npm install webpack webpack-cli style-loader css-loader html-webpack-plugin vue-loader vue-template-compiler webpack…

Android入门第68天-自动更新/升级怎么做(生产级实例)

开篇 今天我们进入第68讲。 在第60天左右其实很多同学们已经进入了APP应用开发了,因为60天内容足以让大家踏上正实的Android开发生涯。 随着开发的深入,我们发觉日常工作中无非就是一些组件的嵌套、合理应用。当代码迭代、功能迭代越来越频繁后我们面临着另一个问题,即:…

【iOS】编译二进制文件说明

编译二进制文件说明 如何生成文件路径文件说明第一部分:.o文件第二部分:link第三部分:Segment第四部分:Symbol 如何生成 使用Xcode进行编译 ,会生成二进制相关文件,可以更详细看产物的布局 项目Target -&…

PCL 任意二维图像转点云

目录 一、概述二、代码实现三、结果展示本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。 一、概述 给定任意一张图片,通过代码操作将图片转成点云。图像中包含大量可用信息,其中必不可少的信息为像素坐标和像素值,将像…

中间件复习之-分布式存储系统

单机存储系统介绍 存储引擎:存储系统的发动机,提供数据的增、删、改、查能力,直接决定存储系统的功能(支持怎么样的查询,锁能锁到什么程度)和性能(增删改查速度)。 性能因素 写入方…

Linux DMA-Buf驱动框架

一、DMABUF 框架 dmabuf 是一个驱动间共享buf 的机制,他的简单使用场景如下: 用户从DRM(显示驱动)申请一个dmabuf,把dmabuf 设置给GPU驱动,并启动GPU将数据输出到dmabuf,GPU输出完成后&#xf…

javaWeb项目-ssm+vue网上租车系统功能介绍

本项目源码:java-基于ssmvue的网上租车系统源码说明文档资料资源-CSDN文库 项目关键技术 开发工具:IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架:ssm、Springboot 前端:Vue、ElementUI 关键技术:springboot、…

Perl 语言学习进阶

一、如何深入 要深入学习Perl语言的库和框架,可以按照以下步骤进行: 了解Perl的核心模块:Perl有许多核心模块,它们提供了许多常用的功能。了解这些模块的功能和用法是深入学习Perl的第一步。一些常用的核心模块包括:S…

ArcGIS 10.2软件安装包下载及安装教程!

今日资源:ArcGIS 适用系统:WINDOWS 软件介绍: ArcGIS是一款专业的电子地图信息编辑和开发软件,提供一种快速并且使用简单的方式浏览地理信息,无论是2D还是3D的信息。软件内置多种编辑工具,可以轻松的完成…

docker-compose部署FastDFS分布式文件系统

文章目录 一、技术选型二、fastDFS组成部分三、docker-compose文件四、客户端nginx配置五、存储器spring Boot集成参考文献 一、技术选型 还有一个更好的google FS(但是他不开源,我也没找到社区版一类的可以不要钱使用的)。 最后考虑到我们存…

非对称加密系统解析

目录 1. 概述 2. 非对称加密标准 2.1 RSA 2.2 SM2 2.2.1 SM2私钥 2.2.2 SM2公钥 2.2.3 加密数据格式 2.2.4 签名数据格式 1. 概述 非对称加密中,密钥分为加密密钥和解密密钥两种。发送者用加密密钥对消息进行加密,接收者用解密密钥对密文进行解密…

【redis的基本数据类型】

基本数据类型 Redis的基本数据类型有五种,分别是 StringListHashSetSortedSet 这些基本的数据类型构成了其他数据类型的基石,而这些基本数据类型又对应着不同的底层实现,不同的底层实现往往是针对不同的使用场景做的特殊的优化,…

# RocketMQ 实战:模拟电商网站场景综合案例(六)

RocketMQ 实战:模拟电商网站场景综合案例(六) 一、RocketMQ 实战 :项目公共类介绍 1、ID 生成器 :IDWorker:Twitter 雪花算法。 在 shop-common 工程模块中,IDWorker.java 是 ID 生成器公共类…

第 18章 安全架构设计理论与实践

安全架构是架构面向安全性方向上的一种细分,可关注三个安全方面,即产品安全架构、安全技术体系架构和审计架构,这三个方面可组成三道安全防线。本章主要分析安全威胁、介绍安全模型,在此基础上,就系统、信息、网络和数…

mysql和redis的双写一致性问题

一,使用方案 在使用redis作为缓存的场景下,我们一般使用流程如下 二,更新数据场景 我们此时修改个某条数据,如何保证mysql数据库和redis缓存中的数据一致呢? 按照常规思路有四种办法,1.先更新mysql数据&a…

tcp协议机制的总结(可靠性,提高性能),基于tcp的应用层协议,用udp如何实现可靠传输

目录 总结 引入 可靠性 ​编辑 分析 三次握手 提高性能 其他 常见的基于tcp应用层协议 用udp实现可靠传输 总结 引入 为什么tcp要比udp复杂的多? 因为它既要保证可靠性,又要兼顾性能 可靠性 分析 其中,序列号不止用来排序,还可以用在重传时去重 确认应答是机制中的…

嵌入式软件工程师入何突破瓶颈?

各位关注嵌入式软件工程师发展的朋友们,下面来探讨一下嵌入式软件工程师该如何突破瓶颈。首先要强调的是,不要仅仅将自己局限在嵌入式软件工程师这一角色定位上。 事实上,嵌入式软件工程师已经掌握了诸多业务层面的内容,完全有能力…

硬件SPI读写W25Q64

硬件SPI读写W25Q64 接线图(和软件SPI一样) 使用SPI1,SCK,接PA5;MISO,接PA6;MOSI,接PA7;NSS,可接PA4。 接线图对应:PA5接CLK引脚,PA6…

34 Debian如何配置ELK群集

作者:网络傅老师 特别提示:未经作者允许,不得转载任何内容。违者必究! Debian如何配置ELK群集 《傅老师Debian知识库系列之34》——原创 ==前言== 傅老师Debian知识库特点: 1、拆解Debian实用技能; 2、所有操作在VMware虚拟机实测完成; 3、致力于最终形成Debian知识手…