区块见闻 区块见闻
Ctrl+D收藏区块见闻
首页 > DAI > 正文

LAMA:两大可商用开源大模型同时发布!性能不输 LLaMA,羊驼家族名字都不够用了_Llama

作者:

时间:

来源:量子位

从Meta的LLaMA发展出的羊驼家族一系列大模型,已成为开源AI重要力量。

但LLamA开源了又没全开,只能用于研究用途,还得填申请表格等,也一直被业界诟病。

好消息是,两大对标LLaMA的完全开源项目同时有了新进展。

可商用开源大模型来了,还一下来了俩:

MosaicML推出MPT系列模型,其中70亿参数版在性能测试中与LLaMA打个平手。

Together的RedPajama系列模型,30亿参数版在RTX2070游戏显卡上就能跑。

区块链房地产公司Propy再获两大投资公司投资:11月16日消息,投资公司Mercuria Investment和ITOCHU Corporation旗下联合基金宣布投资区块链房地产公司Propy。具体投资金额暂未公布。(日经新闻)[2020/11/16 20:55:06]

对于这些进展,特斯拉前AI主管AndrejKarpathy认为,开源大模型生态有了寒武纪大爆发的早期迹象。

MPT,与LLaMA五五开

MPT系列模型,全称MosaicMLPretrainedTransformer,基础版本为70亿参数。

MPT在大量数据上训练,与LLaMA相当,高于StableLM,Pythia等其他开源模型。

动态 | 欧洲打击两大暗网市场缴获大量比特币及门罗币:据cointelegraph报道,欧洲刑警组织5月3日宣布,德国与欧洲刑警组织一起关闭了暗网市场Wall Street Market的服务器,并从被捕的嫌疑人手中查货550,000欧元(613,600美元)的现金、总额六位数的比特币和门罗币、几辆汽车、电脑和硬盘等。在同一份声明中,欧洲刑警组织还正式宣布,芬兰海关已捣毁黑网市场Valhalla(也称为Silkkitie)并扣押了大量的比特币。[2019/5/4]

支持84ktokens超长输入,并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。

在各类性能评估中,与原版LLaMA不相上下。

动态 | 美国两大监管机构发布关于数字货币投资虚假声明的警告:据Bitcoinexchangeguide报道,美国证券交易委员会(SEC)和商品期货交易委员会(CFTC)近日发布了关于数字货币投资虚假声明的警告。根据该机构官方声明,欺诈者可能会使用虚假声明来诱投资者并购买数字货币和其他代币,例如ICO提供的代币。SEC通报称,“当有人声称于任何联邦政府机构有关联时,请不要相信此人提供的投资信息,并且在向任何你不认识的人提供个人信息时要保持谨慎”。[2018/10/15]

除了MPT-7BBase基础模型外还有三个变体。

MPT-7B-Instruct,用于遵循简短指令。

MPT-7B-Chat,用于多轮聊天对话。

MPT-7B-StoryWriter-65k+,用于阅读和编写故事,支持65ktokens的超长上下文,用小说数据集微调。

XRP Arrington创始人Michael Arrington谈2018年区块链发展两大趋势:今日,XRP Arrington创始人Michael Arrington谈到2018年区块链发展两大趋势时表示:现在的趋势就是看美国证券交易委员会(SEC)要做什么,他们会进一步毁掉美国的交易,会建立一些让我们能够依据的规则,还是会去阻击个体的交易,这是一个趋势。从功能性代币(Utility Token)完全转移到证券型代币(Security Toekn)也是一个趋势,对这点我很兴奋。我们会在证券型代币领域做更多。[2018/2/24]

MosaicML由前英特尔AI芯片项目Nervana负责人NaveenRao创办。

该公司致力于降低训练神经网络的成本,推出的文本和图像生成推理服务成本只有OpenAI的1/15。

RedPajama,2070就能跑

RedPajama系列模型,在5TB的同名开源数据上训练而来。

除70亿参数基础模型外,还有一个30亿参数版本,可以在5年前发售的RTX2070游戏显卡上运行。

目前70亿版本完成了80%的训练,效果已经超过了同规模的Pythia等开源模型,略逊于LLamA。

预计在完成1Ttokens的训练后还能继续改进。

背后公司Together,由苹果前高管VipulVedPrakash,斯坦福大模型研究中心主任PercyLiang,苏黎世联邦理工大学助理教授张策等人联合创办。

开源模型发布后,他们的近期目标是继续扩展开源RedPajama数据集到两倍规模。

OneMoreThing

来自南美洲的无峰驼类动物一共4种,已被各家大模型用完了。

Meta发布LLaMA之后,斯坦福用了Alpaca,伯克利等单位用了Alpaca,JosephCheung等开发者团队用了Guanaco。

以至于后来者已经卷到了其他相近动物,比如IBM的单峰骆驼Dromedary,Databricks的Dolly来自克隆羊多莉。

国人研究团队也热衷于用古代传说中的神兽,如UCSD联合中山大学等推出的白泽。

港中文等推出的凤凰……

最绝的是哈工大基于中文医学知识的LLaMA微调模型,命名为华驼。

参考链接:

https://www.mosaicml.com/blog/mpt-7b

https://www.together.xyz/blog/redpajama-models-v1

https://twitter.com/karpathy/status/1654892810590650376?s=20

标签:AMALlamaMakerLAMATakamakaLlamaversemakerdao怎么读ELAMA

DAI热门资讯
BTC:BRC-20爆火,比特币矿工到底赚了多少钱?_RC2价格

原文作者:wesely 相关阅读: BTC?交易费用飙涨,矿工的春天来了,可能带来哪些问题? 2023年3月,推特用户?@domodata?为比特币创建的一个实验性?Token?标准.

BTC:从UGC到UGP:消费品牌的”链上共创“范式改变_比特币害死多少人

作者:AleksijaVujicic,MulticoinCapital;翻译:金色财经0x00许多人表示共同创造最终将导致创作者阶层民主,重构粉丝圈,并将粉丝变成创作者;然而.

MAKE:MakerDAO推出DeFi借贷协议Spark_Maker

金色财经报道,稳定币发行商MakerDAO宣布推出Spark,这是一种以DAI稳定币为中心的DeFi借贷协议。DAI是第四大稳定币,市值为47亿美元,仅次于USDT、USDC和BUSD.

AAVE:ChainAegis:AAVE V2/V3链上数据分析_TiraVerse

2023年1月27日,DeFi借贷协议Aave宣布V3版本已部署在以太坊上。以太坊是Aave部署的第一个网络也是流动性最大的一个网络.

AVE:6月1日渐近,香港真的会向散户开放虚拟资产投资吗?_AAVE

来源:《科创板日报》 记者徐赐豪 图片来源:由无界AI工具生成根据将于2023年6月1日生效的新发牌制度,所有在香港经营业务或向香港投资者积极进行推广的虚拟资产交易平台,将需获证监会发牌.

OIN:以太坊基金会卖币、Meme Coin爆发,市场逃顶信号出现?_比特币行情最新价格美元走势

对于经历了上一轮牛市的投资者来说,「以太坊基金会卖币」一直是一个颇为可靠的逃顶信号。另一个为人津津乐道的逃顶信号,即memeCoin的爆发。目前的加密市场,已经集齐这两点.