来源:量子位
随便一张照片,就可生成3D头像。而且光线真实,任意角度可调。
这是苹果的最新黑科技生成框架FaceLit。
正如其名,FaceLit的特色就是可以将人脸“点亮”。
“自带光环”的FaceLit在易用性上也不输同类,甚至更胜一筹——
进行3D建模时,需要的照片素材无需专门选择角度,数量上也只需一张。
甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。
而传统的头像合成工具或者需要多张图片才能工作,或者对照片角度有刁钻的要求。
正是凭借这一创新,FaceLit获得了3.5的FID评分,较同类产品直接高出了25%。
动态 | 农业农村部:利用区块链等信息技术 实现全国农药质量追溯“一张网”:据农业农村部2月12日消息,为贯彻落实中央农村工作会议、全国农业农村厅局长会议及全国农药管理工作会议精神,农业农村部于近日印发《2020年农药管理工作要点》。其中提到2020年农药管理工作包括完善质量追溯体系。利用区块链等现代信息技术,加快构建全国统一的质量追溯系统,逐步实现全国农药质量追溯“一张网”。完善标签管理办法,推行农药内外包装二维码关联,逐步实现农药生产、经营、使用全链条可追溯。[2020/2/12]
改进式EG3D合成人像,光线信息单独处理
下面就来看一下FaceLit具体是如何实现头像合成的。
总的来说,苹果采用了将人物本体与光线分别处理再进行叠加的策略。
早期的三维人像合成工具在转换过程中可能产生形变。
而爆火的NeRF通过将场景拆分成具体因素,提高了3D图像合成效果,改善了这一问题。
声音 | 张楠赓:烤猫失踪唯一可查询记录是一张去往泰国的机票购买记录:据腾讯新闻《潜望》消息,嘉楠董事长张楠赓接受采访时透露,寄望于通过联合挖矿来翻身的烤猫,在发现自己被之后,离奇失踪,唯一可查询的记录是一张去往泰国的机票购买记录,但至今仍下落不明。张楠赓提起烤猫的悲剧仍是一身冷汗,“因为差点被的就是我。”令他遗憾的是,当初了烤猫的那帮人,至今仍活跃在矿圈,逍遥法外。[2020/1/2]
但苹果团队认为,在可控性方面,NeRF仍存有不足之处。
于是,在EG3D框架的基础上,苹果创造了FaceLit的合成模型。
EG3D通过三平面解码器,赋予了二维卷积神经网络生成渲染3D模型所需深度参数的能力。
苹果团队对标准的EG3D训练方式进行了扩展,并将之转化成了FaceLit框架。
动态 | Telx技术公司推出世界上第一张加密SIM卡:据AMBCrypto消息,电信公司Telx Technologies宣布推出一款SIM卡,可以通过短信处理加密货币。该项目背后的议程是让人们可以在不需要智能手机、互联网连接或钱包应用/地址的情况下进行国际汇款。据Telx称,这款手机将成为世界上第一张用于这一目的的SIM卡。[2019/8/24]
△FaceLit与传统EG3D渲染流程对比图
标准的ED3G使用相机位置p参数作为基本输入参数。
在建立GAN2操作时,苹果在EG3D的基础上加入了光照参数l。
不同p(左→右)与l(上→下)值下的初始图像
苹果选择了经过球形谐波方式简化后的Phong反射模型作为处理光源的物理基础。
动态 | 云南近日开出全国第一张区块链电子冠名发票:近日,在由云南省人民政府主办的2019年首届“数字云南”区块链国际论坛上,云南省省长阮成发与腾讯副总裁、腾讯云总裁邱跃鹏一道,通过“游云南”平台共同开出全国第一张区块链电子冠名发票。这是云南省与腾讯公司将区块链应用于税务领域的一次新探索。(科技日报)[2019/8/6]
光照参数l就是在这一基础之上独立处理得到的。
在自然界中,反射包括镜面反射和漫反射两种形式。
△不同镜面反射率条件下的效果对比
因此,苹果在ED3G模型中加入了镜面反射解码器和漫反射解码器。
它们替代了可以直接得到颜色c、密度σ数据的三平面解码器。
动态 | 外媒:万事达卡已批准欧洲第一张加密借记卡:据Blog.Coinspectator消息,万事达卡已批准欧洲第一张加密借记卡。Tap n Go (Tap)已与Transact Payments Limited (TPL)合作,提供TapPrepaidMastercard?,允许客户在接受万事达卡消费的场景中使用Tap持有的加密资产。据悉,Tap n Go已向直布罗陀金融服务委员会申请DLT牌照,目前正在审查中。[2019/4/30]
△反射解码器流程示意图
通过对GAN2产生的数据进行再次解码,可以得到镜面反射率ks和漫反射率kd。
然后再通过两种反射着色器得到颜色c,密度σ则由漫反射解码器计算得出。
最终,FaceLit以与三平面解码器相同的参数渲染图像,并进行分辨率优化。
有的放矢设计训练策略,数据无需人工标注
生成框架已有,那就来到训练阶段,其特点在于训练过程中无需人工标注。
方法论层面,在训练时,团队使用了FFHQ、MetFaces和CelebA-HQ数据集。
对于不同的数据集,苹果使用了不同的训练方式。
FFHQ包含了7万余条人脸数据,其训练分为两个阶段:先在较低的分辨率下训练,再提高分辨率再次进行。
对于包含2万数据量的CelebA-HQ,训练不需要分阶段进行。
而对于更小的MetFAces,则只需要通过ADA扩容的方式,使用预训练的FFHQ进行优化调整即可。
定性地看,训练结果在机位、光源和反射高光等方面都有出色的表现,图中的细节也有所增强。
△FaceLit生成的头像唇齿部位的细节进行了明显重构
定量结果同样表明,FaceLit在FID、KID等指标上均优于包括标准EG3D在内的传统生成方式。
在使用FFHQ作为训练集的条件下,各生成方式的表现如下表,不难看出FaceLit拥有最低的FID和KID值。
而相比于英伟达的StyleGAN2,FaceLit的表现依旧出色:
光线准确度方面,FaceLit在使用三种不同训练数据集的情况下,与人工设定的标准值平均均方误差均低于0.01。
网友:人们低估了苹果AI
消息发出后,便有网友认为“这是对更重磅产品的预热”。
更有网友直接推测,FaceLit的出现标示着人工智能将进军AR和VR领域,苹果的混合现实将最终实现商用……
也有网友认为,FaceLit不会商用,否则苹果才不会以论文的形式发表。
针对FaceLit本身,也有网友表示,除了LLM,其他都是浮云,他们如果不开发LLM,就没有未来。
但这位网友同时也说,苹果可能已经在做了。
相应的,也有网友称人们“低估了苹果在AI领域的深度”。
所以各位网友对苹果在AI领域还有什么样的期待呢?
论文地址:https://arxiv.org/abs/2303.15437
GitHub地址:https://github.com/apple/ml-facelit
参考链接:https://twitter.com/AlphaSignalAI/status/1648361623004774400
标签:MASTERHTTAPPLIDMasternethttps://etherscan.io谷壳币appethylidene
原文标题:《DeepDAOResearchpresents:HuntingVoteMiners》原文作者:DEEPDAO.IO?原文编译:Kxp,BlockBeats最近.
作者:PaulVeradittakit,PanteraCapital合伙人;翻译:金色财经0xnaitive 引言 加密技术的进步让Polkadot和Solana等公链的TPS可以达到数千.
金色周刊是金色财经推出的一档每周区块链行业总结栏目,内容涵盖一周重点新闻、行情与合约数据、矿业信息、项目动态、技术进展等行业动态。本文是项目周刊,带您一览本周主流项目以及明星项目的进展.
作者:SteveWang万物研究院研究员,沃顿商学院在读,前端&合约工程师推特:@SteveIsEmployed? 简介 以太坊改进提案4337定义的账户抽象是一组协议层的接口.
原文标题:AcceleratingZero-KnowledgeProofs原文作者:FigmentCapital原文编译:Lynn.
原文来源于?Dappradar,白泽研究院编译,因篇幅原因略有内容删改随着BoredApeYachtClub(BAYC)成立两周年的临近.