区块见闻 区块见闻
Ctrl+D收藏区块见闻
首页 > 火星币 > 正文

EFI:Stable Diffusion 团队放大招!新绘画模型直出 AI 海报,像素级生成_STA

作者:

时间:

来源:量子位

开源AI绘画扛把子,StableDiffusion背后公司StabilityAI再放大招!

全新开源模型DeepFloydIF,一下获星2千+并登上GitHub热门榜。

DeepFloydIF不光图像质量是照片级的,还解决了文生图的两大难题:

准确绘制文字。

以及准确理解空间关系。

数据:参与StarkNet桥接交易的用户量超越Arbitrum,达66万个:8月10日消息,Dune数据显示,参与StarkNet桥接交易的用户量超越Arbitrum,达660,738个,而Arbitrum为660,104个。同时Arbitrum的ETH总跨链桥接数量约27.44万枚,StarkNet为19.59万枚。[2023/8/10 16:17:01]

网友表示,这可是个大事,之前想让Midjourneyv5在霓虹灯招牌上写个字AI都是瞎划拉两笔,对于镜子理解的也不对。

Beanstalk Farms:首批4项BFCP-A提案已开启投票:7月31日消息,算法稳定币项目Beanstalk Farms发推称,首批4项BFCP-A提案已在Snapshot上列出。BFCP-A是Beanstalk Farms委员会的提案,该委员会对BF预算有决定权,包括对贡献者的补偿。这些提案的投票周期是7天,需要25%的法定人数(目前相当于约5300万Stalk)和多数投票才能通过。[2022/7/31 2:49:37]

使用DeepFloydIF,可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画,文字都会以合适的字体、风格、排版出现在合理的地方。

Gate.io Startup首发项目O3已认购成功:据官方公告,Gate.io Startup首发项目O3 Swap (O3)已认购成功,并将于5月14日(今日)开通O3交易并随后开通提现服务,开盘时间将随后公布。据悉,本次认购参与人数共有14,789人,下单总价值超过1,000万美金,认购系数约为0.0031。Gate.io将根据每个人的下单情况和每个下单币种的认购系数进行O3的分发。请务必注意:由于部分用户在下单认购后到当天16点之前,没有保持账户中有不低于认购金额的足够金额,因此被排除在有下单之外。[2021/5/14 22:01:37]

这意味着,AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

摩根士丹利(MORGAN STANLEY):央行可能会用加密货币加强负利率:根据摩根士丹利(Morgan Stanley)的新发现,各国央行可以使用加密货币,使得大幅降息来减轻下一场金融危机的负面影响。[2018/5/15]

目前DeepFloydIF以非商用许可开源,不过团队解释这是暂时的,获得足够的用户反馈后将转向更宽松的协议。

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloydIF仍然基于扩散模型,但与之前的StableDiffusion相比有两大不同。

辟谣:Nexon韩国首席执行官否认有关Bitstamp收购的传言:Nexon韩国首席执行官李正勋表示,Nexon韩国与Bitstamp的收购无关。我们没有计划将加密货币与我们的游戏业务联系起来,但这并不意味着Nexon在其游戏开发工作中排除了区块链的使用,因为分布式账本技术在游戏中有很多潜在的应用。[2018/4/25]

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间,而是直接作用于像素。

官方还提供了一组DeepFloydIF与其他AI绘画模型的直观对比。

可以看出,使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字,AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源,谷歌的几个模型更是连个Demo都不给,DeepFloydIF就成了更实际的选择。

具体生成图像上DeepFloydIF与之前模型一致,语言模型理解文本后先生成64×64分辨率的小图,再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上,通过把指定图像缩小回64×64再使用新的提示词重新执行扩散,也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外,DeepFloydIF的优势还在于,IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中,IF-4.3B取得了最好的FID分数,并达到SOTA。

谁是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的独立研发团队,深受摇滚乐队平克弗洛伊德影响,自称为一只“研发乐队”。

主要成员只有4人,从姓氏来看均为东欧背景。

这次除了开源代码外,团队在HuggingFace上还提供了DeepFloydIF模型的在线试玩。

我们也试了试,很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多,不过既然开源了,相信在中文数据集上训练好的变体也不会太晚出现。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在开源上的唯一动作

语言模型方面,他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna,基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

DeepfloydIF在线试玩:

https://huggingface.co/spaces/DeepFloyd/IF

代码:

https://github.com/deep-floyd/IF

StableVicuna在线试玩:

https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接:

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

标签:EFISTAGAMEDEEPDEFILANCERstarl币团队跑路了吗SHAEL RUNE - Rune.GameDeepCloud AI

火星币热门资讯
MAG:如何用ChatGPT幫你投資?這家美國平台打造出一款神奇“AI投顧”……_NIF

来源:财联社 编辑潇湘 你有没有想过,ChatGPT与美国散户大本营Robinhood结合,会擦出怎样的火花?目前,将人工智能技术应用于金融世界已经是大势所趋.

POL:ETH周报 | 坎昆升级确定纳入EIP-4844;Uniswap Wallet上架App Store(4.24-4.30)_POLY

一、整体概述 根据?ChristineKim?对第?160?次以太坊执行层核心开发者会议进行的总结,本次会议主要讨论在下次坎昆升级中,需要纳入哪些代码修改.

MEFI:梳理Web3游戏发展阶段 以及对其未来的思考_AddMeFast

Web3游戏,也被称为基于区块链的游戏和GameFi,是当今加密领域最引人入胜的领域之一,市场中也涌现出越来越多的项目.

加密货币:美銀行業危機擔憂卷土重來 比特幣強勢反彈_bitkeep的usdt怎么转账出来

随着投资者担忧美国银行业危机进一步深化,比特币引领加密市场强势反弹。比推终端数据显示,比特币打破了连续五天的下跌趋势,突破2.9万美元,盘中一度触及3万美元,市值第二大加密货币以太坊上涨4.5%.

COIN:4月份NFT销售额约为7.32亿美元,环比下降5.76%_EurocoinToken

博链财经BroadChain获悉,5月1日,据Bitcoin.com引援CryptoSlam数据,4月份NFT销售额为7.3212亿美元,与3月份的7.7688亿美元相比下降5.76%.

BLO:OP Research:Blockchain的AI变局_比特币

AI板块相关标的,不论是A股、美股还是Crypto,都迎来了暴涨。之后的时间里,随着ChatGPT被广泛使用,人们意识到其对整个世界的影响,不断有新的ChatGPT应用场景,以及同类型的产品迭代.