区块见闻 区块见闻
Ctrl+D收藏区块见闻
首页 > Gateio > 正文

比特币:Stability AI 连扔两个王炸!首个开源 RLHF 模型登基,DeepFloyd IF 像素级出图_TAB

作者:

时间:

来源:新智元

开源先锋StabilityAI一天扔了两枚重磅炸弹:发布史上首个开源RLHF大语言模型,以及像素级图像模型DeepFloydIF。开源社区狂喜!

最近,大名鼎鼎的StableDiffusion背后的公司,一连整了两个大活。

首先,StabilityAI重磅发布了世上首个基于RLHF的开源LLM聊天机器人——StableVicuna。

StableVicuna基于Vicuna-13B模型实现,是第一个使用人类反馈训练的大规模开源聊天机器人。

有网友经过实测后表示,StableVicuna就是目前当之无愧的13BLLM之王!

对此,1xexited创始人表示,这可以看作是自ChatGPT推出以来的第二个里程碑。

另外,StabilityAI发布了开源模型DeepFloydIF,这个文本到图像的级联像素扩散模型功能超强,可以巧妙地把文本集成到图像中。

这个模型的革命性意义在于,它一连解决了文生图领域的两大难题:正确生成文字,正确理解空间关系!

秉持着开源的一贯传统,DeepFloydIF在以后会完全开源。

StailibityAI,果然是开源界当之无愧的扛把子。

StableVicuna

世上首个开源RLHFLLM聊天机器人StableVicuna,由StabilityAI震撼发布!

观点:以太坊“合并”后gas费用不会降低,但Staking收益会大幅增加:金色财经报道,据DeFi交易员Vivek Raman在社交媒体分析称,与许多人预期的不同,以太坊“合并”后gas费用并不会降低。Vivek Raman解释说,以太坊gas费用过高因为区块需求增加,而不是因为“共识机制”,而“合并”的目标则是弃用以太坊工作量证明共识机制,因此用户想要降低gas费用可以使用Layer 2来减少成本。此外,Vivek Raman预计“合并”后ETH Staking收益至少会增加50%,而目前的Staking收益约为4.2%,验证者也能获得交易费用收入。最新数据显示,当前以太坊信标链总质押量已达到13,682,717 ETH,验证者总量约为40.6万。.[2022/7/14 2:11:44]

一位Youtube主播对StableVicuna进行了实测,StableVicuna在每一次测试中,都击败了前任王者Vicuna。

所以这位Youtuber激动地喊出:StableVicuna就是目前最强大的13BLLM模型,是当之无愧的LLM模型之王!

StableVicuna基于小羊驼Vicuna-13B模型实现,是Vicuna-13B的进一步指令微调和RLHF训练的版本。

而Vicuna-13B是LLaMA-13B的一个指令微调模型。

从以下基准测试可以看出,StableVicuna与类似规模的开源聊天机器人在整体性能上的比较。

XCarnival宣布未来两年投入5000 ETH打造“Security Star”计划:7月2日消息,为了保障XCarnival用户及生态伙伴的利益,XCarnival宣布发起“Security Star”计划,主要包括智能合约安全和保险基金两部分,计划在两年内持续投入5000 ETH,用以保障平台及用户资产安全。

在智能合约安全方面,XCarnival表示再度加强了内部交叉审计机制,并在和CertiK合作的基础上再次引入了新的外部审计机构Peck Shield,并很快将对外推出漏洞悬赏计划。

在保险基金方面,XCarnival将成立XFund,该基金主要面对XCarnival自身及其生态合作伙伴,预计未来两年内投入5000 ETH。该基金主要作用是:

1. 基金将会由XCarnival DAO独立负责运作,其功能是为了保证在XCarnival平台的资产及资金安全。

2. 基金将负责承担极端情况平台在非人为因素下发生损失的赔偿责任,基金成立后将首先对事件中的还未追缴的部分(1620 ETH)进行补偿。

3. 在有借贷资产发生清算时,基金将根据资产的实际情况作为清算发起人进行资产的处理,确保借贷资产安全。

据悉,XCarenival的智能合约也会大约在三周后进行重启。

6月26日,攻击者利用合约漏洞攻击,造成XCarnival平台直接损失3087 ETH。XCarnival团队成员经过与攻击者多轮谈判,首期追缴到1467 ETH。[2022/7/2 1:46:07]

StableVicuna可以做基础数学题。

可以写代码。

还能为你讲解语法知识。

开源聊天机器人平替狂潮

StabilityAI想做这样一个开源的聊天机器人,当然也是受了此前LLaMa权重泄露引爆的ChatGPT平替狂潮的影响。

稳定币聚合协议mStable:20万枚mUSD将分配给dHedge:官方消息,稳定币聚合协议mStable表示,MTA治理委员会已通过使用dHEDGE管理MDP 21.1和MDP 21.2 DAO资金库。资金库中20万枚mUSD将分配给dHedge。这些资金将部署到dHEDGE池的前十名中。[2021/4/11 20:07:45]

从去年春天Character.ai的聊天机器人,到后来的ChatGPT和Bard,都引发了大家对开源平替的强烈兴趣。

这些聊天模型的成功,基本都归功于这两种训练范式:指令微调和人类反馈强化学习(RLHF)。

这期间,开发者一直在努力构建开源框架帮助训练这些模型,比如trlX、trl、DeepSpeedChat和ColossalAI等,然而,却并没有一个开源模型,能够同时应用指令微调和RLHF。

大多数模型都是在没有RLHF的情况下进行指令微调的,因为这个过程十分复杂。

最近,OpenAssistant、Anthropic和Stanford都开始向公众提供RLHF数据集。

StabilityAI把这些数据集与trlX提供的RLHF相结合,就得到了史上第一个大规模指令微调和RLHF模型——StableVicuna。

训练过程

为了实现StableVicuna的强大性能,研究者利用Vicuna作为基础模型,并遵循了一种典型的三级RLHF管线。

Vicuna在130亿参数LLaMA模型的基础上,使用Alpaca进行调整后得到的。

他们混合了三个数据集,训练出具有监督微调(SFT)的Vicuna基础模型:

OpenAssistantConversationsDataset(OASST1),一个人工生成的、人工注释的助理式对话语料库,包含161,443条消息,分布在66,497个对话树中,使用35种不同的语言;

Gate.io Startup BOSON开盘20小时涨幅达1083.55%:据Gate.io芝麻开门行情显示,截至今日12:00,BOSON 开盘20小时最高涨幅108.35%,当前涨幅353.15%,开盘20小时最高价11.8美元,当前报价4.518美元,开盘20小时现货交易量达1357.21万美元。近期行情波动较大,请注意控制风险。[2021/4/10 20:05:05]

GPT4AllPromptGenerations,由GPT-3.5Turbo生成的437,605个提示和响应的数据集;

Alpaca,这是由OpenAI的text-davinci-003引擎生成,包含52,000条指令和演示的数据集。

研究者使用trlx,训练了一个奖励模型。在以下这些RLHF偏好数据集上,研究者得到了SFT模型,这是奖励模型的基础。

OpenAssistantConversationsDataset(OASST1),包含7213个偏好样本;

AnthropicHH-RLHF,一个关于AI助手有用性和无害性的偏好数据集,包含160,800个人类标签;

斯坦福人类偏好(SHP),这是一个数据集,包含348,718个人类对各种不同回答的集体偏好,包括18个从烹饪到哲学的不同学科领域。

最后,研究者使用了trlX,进行近端策略优化(ProximalPolicyOptimization,PPO)强化学习,对SFT模型进行了RLHF训练,然后,StableVicuna就诞生了!

据StabilityAI称,会进一步开发StableVicuna,并且会很快在Discord上推出。

另外,StabilityAI还计划给StableVicuna一个聊天界面,目前正在开发中。

StaFi推出以太坊2.0 Staking流动性解决方案rETH:11月13日消息,提供抵押资产流动性的去中心化协议StaFi Protocol 推出以太坊2.0 Staking(质押)流动困境的解决方案rETH。用户可以通过StaFi部署在ETH上的Staking Contract (质押合约)参与ETH 2.0Staking,质押的金额将不受32ETH的约束,用户质押的数量最小可以是0.01ETH,最大则没有上限。[2020/11/13 14:12:13]

相关演示已经可以在HuggingFace上查看了,开发者也可以在HuggingFace上下载模型的权重,作为原始LLaMA模型的增量。

但如果想使用StableVicuna,还需要获得原始LLaMA模型的访问权限。

获得权重增量和LLaMA权重后,使用GitHub存储库中提供的脚本将它们组合起来,就能得到StableVicuna-13B了。不过,也是不允许商用的。

DeepFloydIF

在同一时间,StabilityAI还放出了一个大动作。

你敢信,AI一直无法正确生成文字这个老大难问题,竟然被解决了?

没错,下面这张「完美」的招牌,就是由StabilityAI全新推出的开源图像生成模型——DeepFloydIF制作的。

除此之外,DeepFloydIF还能够生成正确的空间关系。

模型刚一发布,网友们已经玩疯了:

prompt:Robotholdinganeonsignthatsays"Icanspell".

不过,对于prompt中没有明确说明的文字,DeepFloydIF大概率还是会出错。

prompt:AneonsignofanAmericanmotelatnightwiththesignjavilop

官方演示

顺便一提,在硬件的需求上,如果想要实现模型所能支持的最大1,024x1,024像素输出,建议使用24GB的显存;如果只要256x256像素,16GB的显存即可。

是的,RTX306016G就能跑。

代码实现:https://gist.github.com/Stella2211/ab17625d63aa03e38d82ddc8c1aae151

开源版谷歌Imagen

2022年5月,谷歌高调发布了自家的图像生成模型Imagen。

根据官方演示的效果,Imagen不仅在质量上完胜OpenAI最强的DALL-E2,更重要的是——它能够正确地生成文本。

迄今为止,没有任何一个开源模型能够稳定地实现这一功能。

与其他生成式AI模型一样,Imagen也依赖于一个冻结的文本编码器:先将文本提示转换为嵌入,然后由扩散模型解码成图像。但不同的是,Imagen并没有使用多模态训练的CLIP,而是使用了大型T5-XXL语言模型。

这次,StabilityAI推出的DeepFloydIF复刻的正是这一架构。

甚至在测试中,DeepFloydIF凭借着COCO数据集上6.66的zero-shotFID分数,直接超越了谷歌的Imagen,以及一众竞品。

下一代图像生成AI模型

具体来说,DeepFloydIF是一个模块化、级联的像素扩散模型。

模块化:

DeepFloydIF由几个神经模块组成,它们在一个架构中相互协同工作。

级联:

DeepFloydIF以多个模型级联的方式实现高分辨率输出:首先生成一个低分辨率的样本,然后通过连续的超分辨率模型进行上采样,最终得到高分辨率图像。

扩散:

DeepFloydIF的基本模型和超分辨率模型都是扩散模型,其中使用马尔可夫链的步骤将随机噪声注入到数据中,然后反转该过程从噪声中生成新的数据样本。

像素:

DeepFloydIF在像素空间工作。与潜在扩散模型不同,扩散是在像素级别实现的,其中使用潜在表征。

上面这个流程图展示的就是,DeepFloydIF三个阶段的性能:

阶段1:

基本扩散模型将定性文本转换为64x64图像。DeepFloyd团队已经训练了三个版本的基本模型,每个版本都有不同的参数:IF-I400M、IF-I900M和IF-I4.3B。

阶段2:

为了「放大」图像,团队将两个文本条件超分辨率模型应用于基本模型的输出。其中之一将64x64图像放大到256x256图像。同样,这个模型也有几个版本:IF-II400M和IF-II1.2B。

阶段3:

应用第二个超分辨率扩散模型,生成生动的1024x1024图像。最后的第三阶段模型IF-III拥有700M参数。

值得注意的是,团队还没有正式发布第三阶段的模型,但DeepFloydIF的模块化特性让我们可以使用其他上采样模型——如StableDiffusionx4Upscaler。

团队表示,这项工作展示了更大的UNet架构在级联扩散模型的第一阶段的潜力,从而为文本到图像合成展示了充满希望的未来。

数据集训练

DeepFloydIF是在一个定制的高质量LAION-A数据集上进行训练的,该数据集包含10亿对。

LAION-A是LAION-5B数据集英文部分的一个子集,基于相似度哈希去重后获得,对原始数据集进行了额外的清理和修改。DeepFloyd的定制过滤器用于删除水印、NSFW和其他不适当的内容。

目前,DeepFloydIF模型的许可仅限于非商业目的的研究,在完成反馈的收集之后,DeepFloyd和StabilityAI团队将发布一个完全免费的商业版本。

参考资料:

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stability.ai/blog/deepfloyd-if-text-to-image-model

标签:比特币TABUNADEEP比特币市值多少亿Stabilize BSCLunaDogedeepbrain-chain

Gateio热门资讯
GON:一览Polygon zkEVM生态12个DeFi项目_olympus币总量

原文作者:Karen,ForesightNews3月底,由Polygon打造的新产品PolygonzkEVM?正式发布主网Beta版本.

LAYER:比特幣市場分析:利潤的誘惑_PlayerMint

来源:UkuriaOC,Glassnode翻译:金色财经 介绍? 比特币市场本周遇到阻力,从每周高点30,456美元回落至27,169美元的低点.

UNA:比特币减半叙事上线,生态迎来新时代_bStable

作者|Terry 不知不觉间,伴随着「非典型熊市」的不断变换,加密世界中始终不曾褪色的「减半」叙事逐步临近——当前区块高度距离比特币剩余减半时间已不足一年,减半时间预计为2024年4月28日.

WEB3:港风云涌Web3 肖风博士的区块链到底需要几个币?_区块链专业学什么

前两周长沙出差,结识了一个很有意思的朋友,超维元宇宙的华群总。晚宴之时,我们坐隔壁桌,一开始是普普通通的常规社交尬聊,不知怎么就聊到区块链代币激励,我说:你看过那本《公司制的黄昏:区块链思维与数.

WEB:不翻车不嫌累,月成本仅200元:AI主播攻占直播间_数字人币是什么意思

来源:深响,作者:祖杨 图片来源:由无界AI工具生成你能想象吗?上百平米的直播基地里,工位上空无一人,桌面上数十台电脑屏幕里的AI主播正不知疲倦、神采奕奕地直播着,他们的神态与真人无异.

PAY:比特幣減半開始倒計時 就在1年後_bmxbiking是什么意思

比特币每四年减半,基本决定了加密货币市场荣枯周期。下一次发生在区块840,000的比特币减半,距离今天还有366天.