2025年11月12日,網(wǎng)易云音樂生成式推薦大模型“Climber”正式榮獲全球?qū)W術(shù)會議CIKM2025應(yīng)用類最佳論文獎。據(jù)悉,ACM CIKM由美國計算機協(xié)會(ACM)和信息檢索專業(yè)委員會(SIGIR)發(fā)起,是信息檢索和數(shù)據(jù)挖掘領(lǐng)域頂級學(xué)術(shù)會議之一。網(wǎng)易云音樂以獨立研發(fā)主體身份,在國際推薦算法領(lǐng)域斬獲最佳論文獎,標(biāo)志著中國企業(yè)在推薦系統(tǒng)領(lǐng)域的技術(shù)創(chuàng)新獲得全球?qū)W術(shù)界和工業(yè)界的認(rèn)可。
網(wǎng)易云音樂生成式推薦大模型“Climber”是國內(nèi)深度融合大模型生成式技術(shù)與推薦系統(tǒng)的標(biāo)桿性成果。該模型在推薦場景中系統(tǒng)性破解了Transformer架構(gòu)的scaling law縮放難題,創(chuàng)新采用多元混合序列建模方案與全新多任務(wù)學(xué)習(xí)范式,不僅實現(xiàn)了技術(shù)層面的突破性進(jìn)展,更為工業(yè)界提供了可直接復(fù)用的推薦系統(tǒng)優(yōu)化新范式,具備極強的實踐參考價值。

Best Applied Paper Award證書
當(dāng)日,韓國首爾,CIKM 2025頒獎典禮現(xiàn)場,網(wǎng)易云音樂算法團隊?wèi){借生成式推薦大模型Climber榮獲大會“Best Applied Paper Award”最佳論文獎,獲獎概率不到千分之三。該獎項評選標(biāo)準(zhǔn)極嚴(yán),需經(jīng)全球頂尖學(xué)者多輪評議,要求論文在理論深度、技術(shù)創(chuàng)新、實驗嚴(yán)謹(jǐn)、寫作質(zhì)量及產(chǎn)業(yè)落地等維度全面領(lǐng)先。今年與網(wǎng)易云音樂同臺競技者包括Google、Amazon、meta、Microsoft、Airbnb、字節(jié)、騰訊、阿里、快手等全球科技巨頭,以及MIT、Stanford、CMU、清華、北大等世界頂尖高校,競爭異常激烈。

CIKM頒獎現(xiàn)場

網(wǎng)易云音樂團隊代表在CIKM晚會上登臺領(lǐng)獎
Transformer作為自然語言處理(NLP)領(lǐng)域的“明星架構(gòu)”,是GPT等生成式大模型的核心基石,其憑借自注意力機制對序列依賴關(guān)系的強大捕捉能力,在語言理解任務(wù)中表現(xiàn)卓越。然而,當(dāng)將其遷移至推薦系統(tǒng)場景時,卻面臨 “長序列建模能力不足、多業(yè)務(wù)場景適配性差、推理效率偏低” 等一系列核心挑戰(zhàn),成為制約推薦系統(tǒng)性能突破的關(guān)鍵瓶頸。
比如,推薦領(lǐng)域的用戶行為天然具有不確定性。用戶可能早間聆聽搖滾、午間切換至輕音樂、晚間轉(zhuǎn)向民謠,這類行為缺乏固定“語法”邏輯,甚至夾雜誤點歌曲等噪聲數(shù)據(jù),與NLP語言序列的強邏輯性截然不同;同時,不同推薦場景的用戶行為模式差異顯著,傳統(tǒng) Transformer架構(gòu)難以適配這種場景分化:例如“每日推薦”需深度挖掘用戶長期偏好,“私人漫游”則更側(cè)重捕捉近期互動軌跡。在此情形下,若單純追求Transformer模型的規(guī)模擴容,不僅會陷入用戶核心興趣難以精準(zhǔn)捕捉、多場景適配能力不足的困境,還會面臨離線訓(xùn)練效率低下、在線推理延遲過高等工業(yè)落地難題,最終嚴(yán)重影響用戶的實際使用體驗。

CIKM會議期間技術(shù)報告現(xiàn)場
網(wǎng)易云音樂算法團隊在CIKM會上發(fā)表技術(shù)報告,深入剖析了獲獎?wù)撐摹禖limber: Toward Efficient Scaling Laws for Large Recommendation Models》的核心創(chuàng)新。報告詳細(xì)闡述了團隊如何攻克以上困難,通過多項算法技術(shù)突破,實現(xiàn)了讓生成式大模型“聽懂”音樂,為推薦系統(tǒng)的高效規(guī)模化發(fā)展提供了全新解決方案。

網(wǎng)易云音樂Climber模型架構(gòu)
網(wǎng)易云音樂生成式推薦大模型“Climber”的核心思路是基于推薦場景的特點,重構(gòu)Transformer的關(guān)鍵模塊。具體來說,它包含三大核心創(chuàng)新組件:多尺度序列提取(MSE)、自適應(yīng) Transformer層(ATL)、逐位門控融合(BGF)。這三個組件環(huán)環(huán)相扣,分別解決“長序列計算效率”、“多場景適配”、“多興趣融合”的問題。
在這種算法模型建構(gòu)的基礎(chǔ)上,網(wǎng)易云音樂生成式推薦大模型“Climber”實現(xiàn)了更高效的Scaling law效率(Scaling Law是指模型性能會隨著數(shù)據(jù)量、參數(shù)規(guī)模和計算資源的同步擴大而呈現(xiàn)可預(yù)測的提升趨勢 ),并進(jìn)一步揭示了在同等算力(模型執(zhí)行浮點運算的總次數(shù)FLOPS)情況下,需要在Transformer層數(shù)(Layer Number)和序列長度(Sequence Length)兩個方向的Scaling up保持相對均衡的條件下,才能帶來效果最優(yōu)的結(jié)果。

“Climber”還同時從“架構(gòu)設(shè)計-加速技術(shù)-資源分配”三個層面協(xié)同優(yōu)化,讓推薦模型既能“變大”(捕捉更多信息),又能“跑快”(控制資源消耗)。而此前,行業(yè)內(nèi)的解決方案存在明顯短板,沒有形成“效果-效率”雙優(yōu)的閉環(huán),無法滿足工業(yè)級推薦“大”和“快”兼?zhèn)涞男枨蟆?/p>
目前,網(wǎng)易云音樂生成式推薦大模型“Climber”已全面應(yīng)用于網(wǎng)易云音樂的心動模式、每日推薦、私人漫游、歌單推薦、新歌推薦等核心場景。以用戶最熟悉的“每日推薦”場景為例,“Climber”上線后紅心率和每小時紅心行為數(shù)據(jù)均有大幅提升,能顯著改善用戶體驗。同時,該模型也成功復(fù)用于會員推薦等多元業(yè)務(wù),幫助業(yè)務(wù)效率實現(xiàn)顯著提升。“Climber”實驗測試期間,測試用戶普遍反饋每日推薦的歌曲結(jié)果質(zhì)量更高,每天打開App都有更精準(zhǔn)新鮮的好音樂。
憑借卓越的泛化能力,網(wǎng)易云音樂生成式推薦大模型“Climber”的架構(gòu)設(shè)計已被多家行業(yè)平臺借鑒,成為推薦大模型工程化落地的標(biāo)桿范式,進(jìn)而引領(lǐng)行業(yè)技術(shù)路線。據(jù)了解,憑借精準(zhǔn)的個性化推薦能力,網(wǎng)易云音樂被譽為 “最懂你的音樂 APP”,其多項推薦算法創(chuàng)新成果接連登陸KDD、CIKM、WWW、ICDM、DASFAA等全球頂尖學(xué)術(shù)會議。隨著推薦系統(tǒng)向更復(fù)雜、更多樣的方向發(fā)展,網(wǎng)易云音樂將繼續(xù)推動推薦技術(shù)向“更精準(zhǔn)、更高效、更個性化”的目標(biāo)邁進(jìn),持續(xù)引領(lǐng)音樂推薦體驗升級。











