在线教程｜图灵奖得主Yann LeCun盛赞！小红书开源InstantID，一张原图即可定制多种风格写真

不久前，一群来自小红书的 95 后工程师联合北大团队发布了开源项目「InstantID」，只需上传一张照片，这款 AI 写真神器就能轻松定制多种风格的 AI 写真，告别繁琐修图。
InstantID 一经发布就引起了广泛关注，GitHub 收藏量达到了 9.9K，图灵奖得主 Yann LeCun 也在自己的社交账号上转发了团队以其形象生成的示例，表示支持。

过去，主题驱动的文本到图像生成，通常需要在多张含有该主题（如人物、风格）的数据集上进行训练，其代表性方案包括 DreamBooth、LoRAs 等，但此类方案的高存储需求、耗时的微调过程，让很多用户望而却步，导致其无法在真实场景中得到快速应用，而 InstantID 的出现则打破了这个僵局。
在这里插入图片描述

InstantID 架构

InstantID 的工作原理主要分为三部分：
ID Embedding：通过预训练的面部识别模型，将语义人脸特征提取为 Face Embedding。该嵌入富含语义信息，如面部特征、表情、年龄等，为后续图像的生成提供坚实基础。
ImageAdapter：引入轻量级适配模块，将提取的身份信息与文本提示结合。通过解耦的交叉注意力机制，图像和文本能够独立地影响图像的生成，在保持身份信息的同时还可以对图像风格进行精细控制。
IdentityNet：它通过强语义条件（如面部特征的详细描述）和弱空间条件（如面部关键点的位置）来编码参考面部图像的复杂特征。生成过程由 Face Embedding 引导，无需文本信息，只需针对新添加的模块进行更新，保持预先训练文本到图像模型的冻结，确保灵活性。
把复杂留给代码，把简单留给用户！ InstantID 不仅在技术上实现了零次个性化图像合成的突破，同时也在用户体验上也做到了极致的简洁和直观。无论你是设计小白还是艺术大师，都能在该平台上，轻松创造出个性化的图像。具体应用场景有：
多 ID 和多风格合成
InstantID 一键实现「跨国合作」！

风格化合成
只需输入一张人脸照片，就能生成多种具有个性化风格的 AI 写真。

逼真合成

这些图真的是合成的吗？

ID 插值

还可以将杨幂和 Taylor 的形象融合。（ps：利用该功能，还可以根据父母双方面部权重，预测未来孩子长相哦！）

新视角合成

一张原图+一张风格参考图=百变大咖

非人像合成
人物和动物融合会发生什么？

这么多风格供你挑选，小伙伴们是不是等不及来试一下啦！不要着急，HyperAI超神经已经上线了「InstantID 个性化写真生成 Demo」教程，该教程为大家搭建好了环境，点击克隆即可一键启动，快来实现你的「七十二变」吧！

公共教程地址：

https://hyper.ai/tutorials/31559

Demo 运行

2.页面跳转后，点击右上角「克隆」，将该教程克隆至自己的容器中。点击右下角「下一步：选择算力」。

3.跳转后，选择「NVIDIA GeForce RTX 4090 」，点击「下一步：审核」。新用户使用下方邀请链接注册，还可获得 4 小时 RTX 4090 + 5 小时CPU的免费算力时长！
HyperAI超神经专属邀请链接（直接复制到浏览器打开）：https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej