MASTER:一张照片生成 3D 头像！苹果新模型击败 StyleGAN2，表情光线都能调_ethylidene

作者：

时间：

来源：量子位

随便一张照片，就可生成3D头像。而且光线真实，任意角度可调。

这是苹果的最新黑科技生成框架FaceLit。

正如其名，FaceLit的特色就是可以将人脸“点亮”。

“自带光环”的FaceLit在易用性上也不输同类，甚至更胜一筹——

进行3D建模时，需要的照片素材无需专门选择角度，数量上也只需一张。

甚至对表情、发型、眼镜等元素进行调节时，也不需要额外素材。

而传统的头像合成工具或者需要多张图片才能工作，或者对照片角度有刁钻的要求。

正是凭借这一创新，FaceLit获得了3.5的FID评分，较同类产品直接高出了25%。

动态 | 农业农村部：利用区块链等信息技术实现全国农药质量追溯“一张网”:据农业农村部2月12日消息，为贯彻落实中央农村工作会议、全国农业农村厅局长会议及全国农药管理工作会议精神，农业农村部于近日印发《2020年农药管理工作要点》。其中提到2020年农药管理工作包括完善质量追溯体系。利用区块链等现代信息技术，加快构建全国统一的质量追溯系统，逐步实现全国农药质量追溯“一张网”。完善标签管理办法，推行农药内外包装二维码关联，逐步实现农药生产、经营、使用全链条可追溯。[2020/2/12]

改进式EG3D合成人像，光线信息单独处理

下面就来看一下FaceLit具体是如何实现头像合成的。

总的来说，苹果采用了将人物本体与光线分别处理再进行叠加的策略。

早期的三维人像合成工具在转换过程中可能产生形变。

而爆火的NeRF通过将场景拆分成具体因素，提高了3D图像合成效果，改善了这一问题。

声音 | 张楠赓：烤猫失踪唯一可查询记录是一张去往泰国的机票购买记录:据腾讯新闻《潜望》消息，嘉楠董事长张楠赓接受采访时透露，寄望于通过联合挖矿来翻身的烤猫，在发现自己被之后，离奇失踪，唯一可查询的记录是一张去往泰国的机票购买记录，但至今仍下落不明。张楠赓提起烤猫的悲剧仍是一身冷汗，“因为差点被的就是我。”令他遗憾的是，当初了烤猫的那帮人，至今仍活跃在矿圈，逍遥法外。[2020/1/2]

但苹果团队认为，在可控性方面，NeRF仍存有不足之处。

于是，在EG3D框架的基础上，苹果创造了FaceLit的合成模型。

EG3D通过三平面解码器，赋予了二维卷积神经网络生成渲染3D模型所需深度参数的能力。

苹果团队对标准的EG3D训练方式进行了扩展，并将之转化成了FaceLit框架。

动态 | Telx技术公司推出世界上第一张加密SIM卡:据AMBCrypto消息，电信公司Telx Technologies宣布推出一款SIM卡，可以通过短信处理加密货币。该项目背后的议程是让人们可以在不需要智能手机、互联网连接或钱包应用/地址的情况下进行国际汇款。据Telx称，这款手机将成为世界上第一张用于这一目的的SIM卡。[2019/8/24]

△FaceLit与传统EG3D渲染流程对比图

标准的ED3G使用相机位置p参数作为基本输入参数。

在建立GAN2操作时，苹果在EG3D的基础上加入了光照参数l。

不同p(左→右)与l(上→下)值下的初始图像

苹果选择了经过球形谐波方式简化后的Phong反射模型作为处理光源的物理基础。

动态 | 云南近日开出全国第一张区块链电子冠名发票:近日，在由云南省人民政府主办的2019年首届“数字云南”区块链国际论坛上，云南省省长阮成发与腾讯副总裁、腾讯云总裁邱跃鹏一道，通过“游云南”平台共同开出全国第一张区块链电子冠名发票。这是云南省与腾讯公司将区块链应用于税务领域的一次新探索。（科技日报）[2019/8/6]

光照参数l就是在这一基础之上独立处理得到的。

在自然界中，反射包括镜面反射和漫反射两种形式。

△不同镜面反射率条件下的效果对比

因此，苹果在ED3G模型中加入了镜面反射解码器和漫反射解码器。

它们替代了可以直接得到颜色c、密度σ数据的三平面解码器。

动态 | 外媒：万事达卡已批准欧洲第一张加密借记卡:据Blog.Coinspectator消息，万事达卡已批准欧洲第一张加密借记卡。Tap n Go （Tap）已与Transact Payments Limited （TPL）合作，提供TapPrepaidMastercard?，允许客户在接受万事达卡消费的场景中使用Tap持有的加密资产。据悉，Tap n Go已向直布罗陀金融服务委员会申请DLT牌照，目前正在审查中。[2019/4/30]

△反射解码器流程示意图

通过对GAN2产生的数据进行再次解码，可以得到镜面反射率ks和漫反射率kd。

然后再通过两种反射着色器得到颜色c，密度σ则由漫反射解码器计算得出。

最终，FaceLit以与三平面解码器相同的参数渲染图像，并进行分辨率优化。

有的放矢设计训练策略，数据无需人工标注

生成框架已有，那就来到训练阶段，其特点在于训练过程中无需人工标注。

方法论层面，在训练时，团队使用了FFHQ、MetFaces和CelebA-HQ数据集。

对于不同的数据集，苹果使用了不同的训练方式。

FFHQ包含了7万余条人脸数据，其训练分为两个阶段：先在较低的分辨率下训练，再提高分辨率再次进行。

对于包含2万数据量的CelebA-HQ，训练不需要分阶段进行。

而对于更小的MetFAces，则只需要通过ADA扩容的方式，使用预训练的FFHQ进行优化调整即可。

定性地看，训练结果在机位、光源和反射高光等方面都有出色的表现，图中的细节也有所增强。