国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

ITBear旗下自媒體矩陣:

Transformer作者新探索:8B小模型Rnj-1劍指Scaling Law,開啟AI輕量化新篇

   時(shí)間:2025-12-20 05:00:18 來(lái)源:快訊編輯:快訊 IP:北京 發(fā)表評(píng)論無(wú)障礙通道
 

在人工智能領(lǐng)域,一場(chǎng)關(guān)于模型發(fā)展方向的變革正在悄然興起。長(zhǎng)期以來(lái),大模型憑借龐大的參數(shù)規(guī)模和強(qiáng)大的計(jì)算能力占據(jù)主導(dǎo)地位,然而,近期由Essential AI Labs推出的Rnj-1開源模型,卻以80億參數(shù)的“小身板”,為輕量化、開放式AI探索開辟了新路徑。

Rnj-1的誕生,背后有著深厚的學(xué)術(shù)底蘊(yùn)。其研發(fā)團(tuán)隊(duì)核心成員Ashish Vaswani和Niki Parmar,正是2017年那篇具有里程碑意義的論文《注意力就是你所需要的一切》的作者。這篇論文奠定了Transformer架構(gòu)的基礎(chǔ),如今幾乎所有知名大模型,如ChatGPT、Gemini、Claude、Llama等,都采用了這一框架。可以說(shuō),他們是大模型時(shí)代的開創(chuàng)者之一。

然而,隨著行業(yè)的發(fā)展,大模型領(lǐng)域逐漸陷入了“軍備競(jìng)賽”的怪圈。以Google DeepMind CEO哈薩比斯為代表的觀點(diǎn)認(rèn)為,要實(shí)現(xiàn)通用人工智能(AGI),就必須將“擴(kuò)規(guī)模”做到極致,更多數(shù)據(jù)、更多算力、更大模型成為主流追求。但Ashish Vaswani和Niki Parmar卻對(duì)此提出了質(zhì)疑,他們認(rèn)為模型并非越大越聰明,從算力效率角度看,大模型時(shí)代或許已經(jīng)接近尾聲,小模型時(shí)代正悄然來(lái)臨。

Rnj-1正是這種理念的實(shí)踐成果。這款從零開始訓(xùn)練的80億參數(shù)模型,雖然參數(shù)規(guī)模遠(yuǎn)不及那些動(dòng)輒萬(wàn)億的大模型,但它在多個(gè)方面展現(xiàn)出了強(qiáng)大的實(shí)力。在代碼生成領(lǐng)域,Rnj-1 Base與Instruct在Humaneval+、MBPP+等算法類代碼任務(wù),以及BigCodeBench等更廣泛的編程任務(wù)中,表現(xiàn)與最強(qiáng)同規(guī)模開源模型相當(dāng),甚至在某些情況下超越了更大的GPT OSS 20B。

在智能體能力方面,Rnj-1 Instruct表現(xiàn)尤為突出。在SWE-bench上,它的表現(xiàn)比同尺寸模型強(qiáng)出近一個(gè)數(shù)量級(jí),接近大規(guī)模模型水平。它能夠主動(dòng)使用性能分析器檢查瓶頸,提出優(yōu)化方案并進(jìn)行多輪迭代。在Enamel任務(wù)中,Rnj-1 Instruct超越了強(qiáng)力基線;在伯克利函數(shù)調(diào)用排行榜(BFCL)中,其工具使用能力也領(lǐng)先同類模型。

數(shù)學(xué)與科學(xué)推理能力也是Rnj-1的一大亮點(diǎn)。在AIME'25(高難度高中數(shù)學(xué))中,Rnj-1 Instruct的數(shù)學(xué)能力與最強(qiáng)開源模型匹敵;Rnj-1 Base在Minerva-MATH上與同規(guī)模模型保持一致;在GPQA-Diamond(包含生物、物理、化學(xué)的高難度題目)上,表現(xiàn)也接近同尺寸模型中的領(lǐng)先水平。

除了性能出色,Rnj-1對(duì)量化也非常穩(wěn)健。這意味著它能在更便宜、更省電的顯卡上快速運(yùn)行,且模型質(zhì)量幾乎不受影響。從BF16到FP8再到NVFP4,在顯著提升提示密集型工作負(fù)載的token吞吐量的同時(shí),模型質(zhì)量依然穩(wěn)定。Token吞吐量數(shù)據(jù)基于NVIDIA B200 GPU測(cè)得,其中KV Cache的數(shù)據(jù)類型設(shè)為FP8,批大小為128。

Rnj-1之所以能取得如此優(yōu)異的成績(jī),離不開其獨(dú)特的技術(shù)架構(gòu)。它采用全局自注意力機(jī)制(global self-attention)和YaRN技術(shù)。全局自注意力機(jī)制就像為模型配備了一雙“全景眼睛”,無(wú)論輸入多長(zhǎng),都能一次全部看清;YaRN技術(shù)則如同“長(zhǎng)距離閱讀輔助器”,讓模型在32k上下文中仍能保持清晰思考。

Essential AI Labs在研發(fā)Rnj-1的過(guò)程中,秉持著獨(dú)特的理念。他們專注于基礎(chǔ)能力的提升,認(rèn)為強(qiáng)大的預(yù)訓(xùn)練本身就會(huì)產(chǎn)生推理能力,而不是依靠后期堆砌強(qiáng)化學(xué)習(xí)(RL)來(lái)補(bǔ)課。在早期預(yù)訓(xùn)練階段,他們就觀察到模型出現(xiàn)反思與探索式推理的跡象,這印證了“強(qiáng)預(yù)訓(xùn)練是下游成功基礎(chǔ)”的判斷。他們還通過(guò)數(shù)據(jù)分類研究,得到了一種新的“帶重復(fù)懲罰的數(shù)據(jù)分布聚類與混合方法”,提升了模型在STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))方面的能力。在優(yōu)化器方面,他們證明了Muon優(yōu)化器相較AdamW更高效,并開發(fā)了適配大模型的分片策略。

Rnj-1的推出,不僅為AI領(lǐng)域帶來(lái)了新的技術(shù)思路,也在開源生態(tài)中引發(fā)了關(guān)注。當(dāng)前,輕量化開源生態(tài)領(lǐng)域正由中國(guó)企業(yè)主導(dǎo),而Essential AI的開源平臺(tái)以及Rnj-1的推出,旨在推動(dòng)美國(guó)AI開源領(lǐng)域的發(fā)展,搶奪在這一領(lǐng)域的話語(yǔ)權(quán)。這一舉措有望打破“越大越好”的行業(yè)競(jìng)爭(zhēng)格局,加速AI人人可用時(shí)代的到來(lái),讓更多人能夠享受到人工智能帶來(lái)的便利。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭(zhēng)議稿件處理  |  English Version
 
国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级
亚洲欧美一区二区三区极速播放| 激情综合色综合久久综合| 偷拍一区二区三区| 99国产精品国产精品毛片| 日韩欧美国产精品一区| 亚洲成人精品一区| 在线观看精品一区| 中文字幕亚洲在| 粉嫩久久99精品久久久久久夜| 欧美高清一级片在线| 亚洲黄色录像片| 99riav一区二区三区| 精品对白一区国产伦| 久久成人免费网| 日韩精品中文字幕一区二区三区 | 亚洲人精品午夜| 成人黄色软件下载| 欧美激情在线观看视频免费| 国产精品1区2区| 国产精品色呦呦| 99久久久久久| 亚洲国产精品天堂| 日韩欧美电影一区| 国产精品99久| 亚洲情趣在线观看| 欧美日韩性生活| 久久国产婷婷国产香蕉| 久久九九全国免费| 91美女蜜桃在线| 午夜免费久久看| 欧美videos中文字幕| 福利电影一区二区三区| 一区二区三区日韩欧美精品| 3atv在线一区二区三区| 另类小说一区二区三区| 国产亚洲精品bt天堂精选| 成人一区在线看| 亚洲成av人片在线观看| 精品日韩在线观看| 91香蕉视频污在线| 久久精品国产77777蜜臀| 国产人久久人人人人爽| 欧美三级视频在线| 国产一区不卡视频| 亚洲一区免费视频| 久久精品在这里| 欧美日本韩国一区| www.亚洲色图.com| 久久99精品久久久| 亚洲综合免费观看高清完整版| 日韩免费在线观看| 日本韩国欧美一区| 韩国一区二区在线观看| 亚洲一区二区成人在线观看| 26uuu色噜噜精品一区| 在线观看91精品国产入口| 韩国成人在线视频| 亚洲超碰97人人做人人爱| 国产免费成人在线视频| 欧美成人福利视频| 91精品国产综合久久福利| 在线免费精品视频| 91丨九色porny丨蝌蚪| 国产精品99久久久久久似苏梦涵| 亚洲午夜久久久久久久久久久 | 91老司机福利 在线| 国产一区二区三区高清播放| 五月天一区二区| 亚洲激情自拍视频| 91影视在线播放| 欧美视频在线一区二区三区| 亚洲成av人影院在线观看网| 中文字幕精品一区二区精品绿巨人| 欧美巨大另类极品videosbest| 色偷偷88欧美精品久久久| 成人美女视频在线观看18| 九一九一国产精品| 捆绑紧缚一区二区三区视频| 天天做天天摸天天爽国产一区 | 国产一区二区三区视频在线播放| 婷婷综合五月天| 秋霞午夜av一区二区三区| 性久久久久久久| 日韩中文字幕1| 老司机精品视频在线| 国产在线乱码一区二区三区| 国产一区二区免费视频| 国产麻豆视频一区二区| 国产白丝精品91爽爽久久| 国产sm精品调教视频网站| 波多野结衣视频一区| 色综合中文字幕国产| 欧美色综合久久| 日韩免费高清av| 国产亚洲精品7777| 亚洲精品欧美专区| 日韩av一区二区在线影视| 国产在线视频一区二区| 99久久777色| 91精品国产一区二区三区蜜臀 | 欧美偷拍一区二区| 日韩欧美电影一二三| 亚洲国产高清在线观看视频| 亚洲视频精选在线| 日韩不卡一区二区| 波多野结衣在线aⅴ中文字幕不卡| 一本大道久久a久久精二百 | 久久这里只精品最新地址| 国产精品卡一卡二| 日本亚洲最大的色成网站www| 国产黄色精品网站| 欧美日韩中文国产| 国产女同互慰高潮91漫画| 亚洲一区二区三区精品在线| 日本亚洲欧美天堂免费| 成人午夜av在线| 日韩一区二区免费高清| 国产精品久久久爽爽爽麻豆色哟哟| 亚洲chinese男男1069| 成人午夜激情视频| 欧美精品一区二区久久婷婷| 亚洲一区在线观看视频| 99久久精品免费看国产免费软件| 日韩一区二区三区在线| 一区二区三区四区激情| 成人高清在线视频| 久久久久久久久岛国免费| 日韩成人精品在线观看| 欧美性受xxxx| 亚洲人吸女人奶水| 波多野结衣精品在线| 国产片一区二区| 国产一区二区视频在线| 欧美大白屁股肥臀xxxxxx| 亚洲国产日韩综合久久精品| av电影在线观看一区| 久久久一区二区三区| 精品一二三四区| 精品国产欧美一区二区| 久久66热偷产精品| 欧美成人免费网站| 国产美女一区二区| 久久精品亚洲国产奇米99| 国产一区二区女| 中文字幕成人av| 不卡影院免费观看| 日韩美女精品在线| 日本高清不卡在线观看| 国产精品进线69影院| 99久久亚洲一区二区三区青草| 中文字幕+乱码+中文字幕一区| 国产成人精品一区二区三区网站观看| 久久伊人蜜桃av一区二区| 国产福利电影一区二区三区| 国产三级一区二区三区| 成人免费看的视频| 亚洲欧美成人一区二区三区| 在线免费观看不卡av| 日韩精品福利网| 久久久国产午夜精品| 国产成人高清在线| 亚洲欧美日韩中文字幕一区二区三区 | 国产精品久久网站| 色婷婷精品久久二区二区蜜臀av| 一区二区三区在线观看欧美| 欧美美女bb生活片| 国产在线播放一区二区三区| 国产精品免费丝袜| 欧美日韩高清在线| 国产激情一区二区三区| 亚洲精品成人少妇| 欧美精品一区二区三区一线天视频| 国产69精品久久久久毛片| 一区二区三区四区不卡在线 | 北条麻妃一区二区三区| 午夜精品久久久久久久久久久 | 成人精品视频网站| 日日摸夜夜添夜夜添精品视频 | 香蕉久久一区二区不卡无毒影院| 欧美变态口味重另类| 欧美在线不卡一区| 国产福利一区二区三区视频在线| 亚洲中国最大av网站| 国产偷国产偷精品高清尤物| 在线观看成人免费视频| 国产精品正在播放| 日韩精品久久久久久| 亚洲精品国产无天堂网2021| 亚洲精品一区二区三区蜜桃下载| 欧美视频一区二区在线观看| 丰满岳乱妇一区二区三区| 青椒成人免费视频| 亚洲大片在线观看| 亚洲精品免费在线播放| 中文字幕精品综合| 国产亚洲精久久久久久| 精品久久久久久久久久久久包黑料| 欧美日韩色综合| 欧美在线观看一区| 欧美丝袜丝交足nylons图片|