区块见闻 区块见闻
Ctrl+D收藏区块见闻
首页 > TUSD > 正文

LAS:别再用平均池化层了!Meta AI把注意力塞到池化层,性能提升0.3_TerraClassicUSD

作者:

时间:

编辑:LRS

注意力机制这么好用,怎么不把它塞到卷积网络里?最近MetaAI的研究人员提出了一个基于注意力的池化层,仅仅把平均池化层替换掉,就能获得+0.3%的性能提升!

VisualTransformer作为计算机视觉领域的新兴霸主,已经在各个研究任务中逐渐替换掉了卷积神经网络CNN。

ViT与CNN之间存在着许多不同点,例如ViT的输入是imagepatch,而非像素;分类任务中,ViT是通过对类标记进行决策等等。

classtoken实际上是ViT论文原作者提出,用于整合模型输入信息的token。classtoken与每个patch进行信息交互后,模型就能了解到具体的分类信息。

并且在自注意力机制中,最后一层中的softmax可以作为注意力图,根据classtoken和不同patch之间的交互程度,就能够了解哪些patch对最终分类结果有影响及具体程度,也增加了模型可解释性。

但这种可解释性目前仍然是很弱的,因为patch和最后一层的softmax之间还隔着很多层和很多个header,信息之间的不断融合后,很难搞清楚最后一层softmax是否真的可以解释分类。

CRV现报价0.6245美元,24小时跌幅超15%:金色财经报道,数据显示,CRV(Curve DAO)现报价0.624515美元,24小时跌幅为15.4%。行情波动较大,请做好风险控制。

此前消息,Curve Finance称由于Vyper部分版本出现故障,一些稳定币池遭到攻击。安全机构BlockSec称初步分析Curve被攻击导致损失总额超过4200万美元。[2023/7/31 16:08:13]

所以如果ViT和CNN一样有视觉属性就好了!

最近MetaAI就提出了一个新模型,用attentionmap来增强卷积神经网络,说简单点,其实就是用了一个基于注意力的层来取代常用的平均池化层。

仔细一想,池化层和attention好像确实很配啊,都是对输入信息的加权平均进行整合。加入了注意力机制以后的池化层,可以明确地显示出不同patch所占的权重。

Cream Finance已上调KP3R抵押系数至45%:12月14日,DeFi平台Cream Finance官方宣布,针对上调KP3R的抵押系数相关投票已获通过,并已被执行。现在KP3R的抵押系数已从0%上调至45%。[2020/12/15 15:16:40]

并且与经典ViT相比,每个patch都会获得一个单一的权重,无需考虑多层和多头的影响,这样就可以用一个简单的方法达到对注意力可视化的目的了。

在分类任务中更神奇,如果对每个类别使用不同颜色进行单独标记的话,就会发现分类任务也能识别出图片中的不同物体。

基于Attention的池化层

文章中新提出的模型叫做PatchConvNet,核心组件就是可学习的、基于attention的池化层。

声音 | Morgan Creek创始人:2018年熊市使比特币比以往更强劲:Morgan Creek创始人Anthony Pompliano发推文称,比特币的市值突破了2000亿美元,2018年的熊市让比特币比以往更加强劲。[2019/6/26]

模型架构的主干是一个卷积网络,相当于是一个轻量级的预处理操作,它的作用就是把图像像素进行分割,并映射为一组向量,和ViT中patchextraction操作对应。

最近也有研究表明,采用卷积的预处理能让模型的性能更加稳定。

模型的第二部分column,包含了整个模型中的大部分层、参数和计算量,它由N个堆叠的残差卷积块组成。每个块由一个归一化、1*1卷积,3*3卷积用来做空间处理,一个squeeze-and-excitation层用于混合通道特征,最后在残差连接前加入一个1*1的卷积。

Glassnode:Uniswap团队可能在团队代币分配方面误导了社区:金色财经报道,Glassnode最近发布的文章对Uniswap的去中心化提出了质疑,同时暗示该平台的开发人员可能在团队如何分配UNI代币方面误导了社区。Glassnode称,Uniswap的团队、投资者和顾问已经分配了所有UNI代币中的40%,其中21.51%分配给了投资者和顾问。然而,这些代币的分发本应持续4年,目前缺乏一个公开的时间表。团队和投资者的代币似乎也没有被锁定。Glassnode还批评了该项目的治理,其指出,如果要提交提案,一个人必须拥有UNI全部供应量的至少1%。但是,由于尚未释放全部供应,此阈值实际上是当前循环供应的8%。[2020/9/25]

研究人员对模型块的选择也提出了一些建议,例如在batchsize够大的情况下,BatchNorm往往效果比LayerNorm更好。但训练大模型或者高分辨率的图像输入时,由于batchsize更小,所以BatchNorm在这种情况下就不太实用了。

Glassnode联合创始人:比特币HODLer们比以往任何时候都更加看涨:数据显示,比特币HODLer们——专注于长期持有比特币的一类投资者——比以往任何时候都更加看涨。6月27日,加密数据分析平台Glassnode联合创始人Rafael Schultze-Kraft在推特上分享了关于这个主题的观点,试图强调为什么链上数据显示比特币“长期极为看涨”。Rafael Schultze-Kraft发表此观点的基本前提是,HODLer持有的比特币越多,潜在的抛售压力就越小。

以下是他的一些观点,这些观点都得到了链上数据和图表的支持:

- 在所有流通的比特币中,有61%的比特币一年多没有移动;

- “平均每年Coin Days Destroyed(每天消失的币龄,即比特币交易数量乘以上次交易后滞留的天数)一直在减少,目前处于2016年以来的最低水平。”这表明存在更多的长期持有者;

- 在过去的几年里,交易所钱包持有的比特币数量急剧下降;

- 被认为属于HODLer的地址正在增加持有比特币,而不是出售。(Bitcoinist)[2020/6/28]

下一个模块就是基于注意力的池化层了。

在主干模型的输出端,预处理后的向量通过类似Transformer的交叉注意力层的方式进行融合。

注意力层中的每个权重值取决于预测patch与可训练向量之间的相似度,结果和经典ViT中的classtoken类似。

然后将产生的d维向量添加到CLS向量中,并经过一个前馈网络处理。

与之前提出的class-attentiondecoder不同之处在于,研究人员仅仅只用一个block和一个head,大幅度简化了计算量,也能够避免多个block和head之间互相影响,从而导致注意力权重失真。

因此,classtoken和预处理patch之间的通信只发生在一个softmax中,直接反映了池化操作者如何对每个patch进行加权。

也可以通过将CLS向量替换为k×d矩阵来对每个类别的attentionmap进行归一化处理,这样就可以看出每个块和每个类别之间的关联程度。

但这种设计也会增加内存的峰值使用量,并且会使网络的优化更加复杂。通常只在微调优化的阶段以一个小的学习率和小batchsize来规避这类问题。

实验结果

在图像分类任务上,研究人员首先将模型与ImageNet1k和ImageNet-v2上的其他模型从参数量,FLOPS,峰值内存用量和256张图像batchsize下的模型推理吞吐量上进行对比。

实验结果肯定是好的,可以看到PatchConvNet的简单柱状结构相比其他模型更加简便和易于扩展。对于高分辨率图像来说,不同模型可能会针对FLOPs和准确率进行不同的平衡,更大的模型肯定会取得更高的准确率,相应的吞吐量就会低一些。

在语义分割任务上,研究人员通过ADE20k数据集上的语义分割实验来评估模型,数据集中包括2万张训练图像和5千张验证图像,标签超过150个类别。由于PatchConvNet模型不是金字塔式的,所以模型只是用模型的最后一层输出和UpperNet的多层次网络输出,能够简化模型参数。研究结果显示,虽然PatchConvNet的结构更简单,但与最先进的Swin架构性能仍处于同一水平,并且在FLOPs-MIoU权衡方面优于XCiT。

在检测和实例分割上,研究人员在COCO数据集上对模型进行评估,实验结果显示PatchConvNet相比其他sota架构来说,能够在FLOPs和AP之间进行很好的权衡。

在消融实验中,为了验证架构问题,研究人员使用不同的架构对比了Transformer中的classattention和卷积神经网络的平均池化操作,还对比了卷积主干和线性投影之间的性能差别等等。实验结果可以看到卷积主干是模型取得最佳性能的关键,class-attention几乎没有带来额外的性能提升。

另一个重要的消融实验时attention-basedpooling和ConvNets之间的对比,研究人员惊奇地发现可学习的聚合函数甚至可以提高一个ResNet魔改后模型的性能。

通过把attention添加到ResNet50中,直接在Imagenet1k上获得了80.1%的最高准确率,比使用平均池化层的baseline模型提高了+0.3%的性能,并且attention-based只稍微增加了模型的FLOPs数量,从4.1B提升到4.6B。

参考资料:

https://arxiv.org/abs/2112.13692

标签:TTECLASSLASASSpolkadottedTerraClassicUSDReality Clash Coinethereum-classic

TUSD热门资讯
SAS:海南华研与自然资源部第三海洋研究所签署战略合作协议_SASUKE币

12月24日上午,2021中国国际海洋产业博览会在海口海南国际会展中心隆重开幕,同时召开海洋生物资源保护与利用论坛暨自然资源部第三海洋研究所科技成果转化对接会.

HAC:品牌、销量双丰收,理想汽车走在了中国品牌的前列!_AAA价格

日前,根据CBERI斯贝瑞品牌进军研究院发布的11月份汽车品牌经济指数显示,前十的位次中,除了吉利、比亚迪以外,又多出了一位我们自主品牌的新面孔,它就是理想汽车.

KEN:申请新图形雷军签名商标,小米的外观专利如何?_OPS

近日,小米科技有限责任公司申请图形商标,国际分类涉建筑材料,智慧芽数据显示,申请日期为2021年11月,该图形为雷军个人签名.

金鱼:盘点最贵的海鱼,贵的绝对想不到_生鱼片

鱼是进补的良好水产食品,不仅味道鲜美,而且还有保健功效。不同鱼的功效与作用各有些不同。 图为食用淡水鱼 生活中有很多的人喜欢吃鱼,老话常说吃鱼的人头脑聪明,想来也是有一定的道理的,鱼的营养价值非.

元宇宙:深扒元宇宙:一个世纪前的科幻概念,为何今天大火?_金鱼

「本文来源:科普中国」 自2021年下半年起,“元宇宙”的概念持续升温。当大众还在理解这个新概念时,一些国内外科技巨头已在元宇宙领域展开布局.

元宇宙:初识百度元宇宙“希壤”_imtoken官网appp

百度元宇宙“希壤” 百度宣布将在12月27日发布元宇宙“希壤”。用户手机下载安装“希壤APP”,即可进入元宇宙。百度Create2021大会也将在“希壤”里举办,容纳10万人同屏互动.