您好,欢迎您来到国盈网!
官网首页 小额贷款 购房贷款 抵押贷款 银行贷款 贷款平台 贷款知识 区块链

国盈网 > 区块链 > 3d头像制作过程,iphone3d头像咋弄

3d头像制作过程,iphone3d头像咋弄

区块链 岑岑 本站原创

来源:量子比特

任何照片都可以生成3D头像。而且光线是真实的,可以任意角度调节。

这是苹果最新的黑科技生成框架FaceLit。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

顾名思义,FaceLit的特点是能够“点亮”人脸。

FaceLit“自带光环”在易用性上并不逊色甚至更胜一筹——

在3D建模中,不需要为照片素材选择特殊的角度,在数量上只需要一张照片。

甚至在表情、发型、眼镜等元素调整时,也不需要额外的材料。

然而,传统的头像合成工具要么需要多张图片才能工作,要么对照片角度有棘手的要求。

由于这一创新,FaceLit获得了3.5的FID评分,比同类产品高出25%。

改进的EG3D合成人像,光线信息单独处理。

我们来看看FaceLit是如何实现头像合成的。

总的来说,苹果采用的是将文字和光线分别处理,然后叠加的策略。

早期的3D人像合成工具在转换过程中可能会变形。

爆炸式的NeRF提高了3D图像合成效果,通过将场景拆分成特定的因子来改善这个问题。

但苹果团队认为,NeRF在可控性方面仍有不足。

于是,苹果在EG3D框架的基础上,创建了FaceLit的合成模型。

EG3D使2D卷积神经网络能够通过三平面解码器生成渲染3D模型所需的深度参数。

苹果团队扩展了标准的EG3D训练方法,将其转化为FaceLit框架。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

△FaceLit与传统EG3D渲染流程对比图

标准ED3G使用摄像机位置P参数作为基本输入参数。

苹果在建立GAN2操作时,在EG3D中加入了光照参数l。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

具有不同p值(左→右)和l值(上→下)的初始图像

苹果选择了球谐模式简化的Phong反射模型作为处理光源的物理基础。

在此基础上独立处理照明参数L。

在自然界中,反射包括镜面反射和漫反射。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

△不同镜面反射率条件下的效果对比

所以苹果在ED3G机型上增加了镜面解码器和扩散解码器。

它们取代了可以直接获得颜色c和密度σ数据的三平面解码器。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

△反射解码器流程图

通过再次解码由GAN2生成的数据,可以获得镜面反射率ks和漫反射率kd

然后用两个反射着色器获取颜色C,用漫反射解码器计算密度σ。

最后,FaceLit使用与三平面解码器相同的参数(C,W,σ)渲染图像,并优化分辨率。

针对性的设计训练策略,数据不需要人工标注。

生成框架已经有了,所以到了训练阶段,特点是训练过程中不需要手动标记。

在square级别,该团队在训练中使用了FFHQ、MetFaces和CelebA-HQ数据集。

对于不同的数据集,苹果使用了不同的训练方法。

FFHQ包含7万多张人脸数据,它的训练分为两个阶段:首先以较低的分辨率进行训练,然后再次提高分辨率。

对于包含20,000个数据的CelebA-HQ,训练不需要分阶段进行。

对于较小的MetFAces,只需要使用预先训练的FFHQ通过ADA容量扩展进行优化和调整。

定性上,训练结果在飞机位置、光源、反光亮点等方面都有出色的表现,画面中的细节也有所增强。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

△FaceLit的头像(左边四列)明显对嘴唇和牙齿的细节进行了重构。

定量结果还表明,FaceLit在FID、KID等指标上优于包括标准EG3D在内的传统生成方法。

在使用FFHQ作为训练集的情况下,各种生成模式的性能如下。不难看出,FaceLit的FID和KID值最低。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

与英伟达的StyleGAN2相比,FaceLit的性能还是很出色的:

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

光照精度方面,三个不同训练数据集的FaceLit平均均方误差低于0.01。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

网友:人们低估了苹果AI。

消息发出后,有网友认为“这是对更重产品的预热。”

有网友直接猜测,FaceLit的出现预示着人工智能将进入AR、VR等领域,苹果的混合现实终将商业化...

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

有网友认为FaceLit不会商业化,否则苹果不会以论文的形式发布。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

对于FaceLit本身,有网友表示,除了LLM,其他都是浮云。如果他们(苹果)不开发LLM,就没有未来。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

但该网友也表示,苹果可能已经在做了(LLM)。

相应的,也有网友表示,人们“低估了苹果在AI领域的深度”。

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

那么网友们对苹果在AI领域有什么期待呢?

地址:https://arxiv.org/abs/2303.15437GitHub地址:https://github.com/apple/ml-facelit参考链接:https://Twitter . com/alpha signal ai/status/1648361623004774400本网站声明网站内容来自互联网。如有侵权,请联系我们,我们会及时处理。

温馨提示:注:内容来源均采集于互联网,不要轻信任何,后果自负,本站不承担任何责任。若本站收录的信息无意侵犯了贵司版权,请给我们来信(j7hr0a@163.com),我们会及时处理和回复。

原文地址"3d头像制作过程,iphone3d头像咋弄":http://www.guoyinggangguan.com/qkl/153010.html

微信扫描二维码关注官方微信
▲长按图片识别二维码