據(jù)海外科技媒體《The Information》披露,OpenAI正秘密推進(jìn)一項(xiàng)音樂(lè)生成技術(shù)研發(fā)項(xiàng)目。這款新型工具突破了傳統(tǒng)AI音樂(lè)的創(chuàng)作邊界,支持通過(guò)文字描述或音頻片段直接生成完整音樂(lè)作品。
內(nèi)部人士透露,該技術(shù)具備強(qiáng)大的音樂(lè)適配能力。在影視制作場(chǎng)景中,創(chuàng)作者可通過(guò)輸入視頻畫(huà)面特征,快速獲得匹配氛圍的原創(chuàng)配樂(lè);音樂(lè)制作人則能利用人聲錄音,自動(dòng)生成吉他、鋼琴等樂(lè)器的實(shí)時(shí)伴奏。這種雙向創(chuàng)作模式將顯著提升音樂(lè)制作效率。
項(xiàng)目推進(jìn)過(guò)程中,OpenAI與世界頂級(jí)音樂(lè)學(xué)府茱莉亞音樂(lè)學(xué)院展開(kāi)深度合作。該校學(xué)生受邀參與音樂(lè)數(shù)據(jù)標(biāo)注工作,通過(guò)解析經(jīng)典樂(lè)譜的結(jié)構(gòu)特征,為模型訓(xùn)練提供專業(yè)級(jí)音樂(lè)語(yǔ)料。這種產(chǎn)學(xué)研結(jié)合的模式,確保了生成音樂(lè)符合專業(yè)審美標(biāo)準(zhǔn)。
值得注意的是,OpenAI此前雖發(fā)布過(guò)音樂(lè)生成模型,但均早于ChatGPT時(shí)代。近期公司戰(zhàn)略明顯向音頻領(lǐng)域傾斜,重點(diǎn)開(kāi)發(fā)文本轉(zhuǎn)語(yǔ)音、語(yǔ)音轉(zhuǎn)文本等交互技術(shù)。此次音樂(lè)生成工具的研發(fā),標(biāo)志著其音頻技術(shù)矩陣的進(jìn)一步完善。
當(dāng)前生成式音樂(lè)市場(chǎng)競(jìng)爭(zhēng)激烈,谷歌、Suno等科技公司已推出類似產(chǎn)品。OpenAI此次技術(shù)突破能否后來(lái)居上,關(guān)鍵在于其多模態(tài)交互能力與專業(yè)音樂(lè)資源的結(jié)合程度。雖然具體發(fā)布時(shí)間尚未確定,但行業(yè)普遍關(guān)注其是否會(huì)整合進(jìn)ChatGPT或視頻生成工具Sora中。











