滾動資訊

當(dāng)前位置：首頁 > 資訊 > 手機(jī)快報(bào) > 正文內(nèi)容

蘋果推出Pico-Banana-400K數(shù)據(jù)集，為AI圖像編輯模型訓(xùn)練提供新助力

時(shí)間：2025-10-29 10:11:09 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

蘋果公司近日推出了一項(xiàng)名為Pico-Banana-400K的圖像研究數(shù)據(jù)集，該數(shù)據(jù)集包含40萬張經(jīng)過精心編輯的圖像，旨在為文本引導(dǎo)的圖像編輯技術(shù)提供更強(qiáng)大的訓(xùn)練和評估資源。這一成果已通過預(yù)印本平臺arXiv發(fā)布，完整數(shù)據(jù)集也在GitHub上向全球研究人員開放，采用非商業(yè)性研究許可協(xié)議，允許學(xué)術(shù)機(jī)構(gòu)自由使用，但禁止商業(yè)用途。

研究團(tuán)隊(duì)指出，當(dāng)前圖像編輯領(lǐng)域雖然技術(shù)進(jìn)步顯著，但開放研究仍面臨數(shù)據(jù)集質(zhì)量不足的挑戰(zhàn)。現(xiàn)有數(shù)據(jù)集多依賴專有模型生成的合成數(shù)據(jù)，或僅包含有限的人工篩選樣本，普遍存在領(lǐng)域偏差、編輯類型分布不均以及質(zhì)量控制不一致等問題，這些問題嚴(yán)重制約了魯棒圖像編輯模型的發(fā)展。為突破這一瓶頸，蘋果團(tuán)隊(duì)決定構(gòu)建一個(gè)更全面、更具代表性的數(shù)據(jù)集。

Pico-Banana-400K的構(gòu)建過程始于對OpenImages數(shù)據(jù)集中真實(shí)照片的篩選，確保樣本涵蓋人物、物體及含文字場景等多樣化內(nèi)容。研究團(tuán)隊(duì)設(shè)計(jì)了35種不同類型的圖像編輯指令，并將其歸類為八大類別，包括像素與光度調(diào)整（如添加復(fù)古濾鏡）、以人為中心的編輯（如將人物轉(zhuǎn)換為卡通風(fēng)格）、場景構(gòu)成與多主體編輯（如改變天氣條件）、對象級語義修改（如移動物體位置）、圖像縮放（如放大畫面）等。

在編輯過程中，研究人員將原始圖像與編輯指令輸入谷歌的Gemini 2.5-Flash-Image模型（也被稱為Nanon-Banana）進(jìn)行生成，隨后利用Gemini 2.5-Pro模型對結(jié)果進(jìn)行自動評估，確保編輯結(jié)果既準(zhǔn)確遵循指令，又具備良好視覺質(zhì)量。只有通過雙重驗(yàn)證的樣本才會被納入最終數(shù)據(jù)集。

該數(shù)據(jù)集不僅包含單輪編輯的樣本，還涵蓋了多輪連續(xù)編輯序列，以及“偏好對”樣本——即成功與失敗編輯結(jié)果的對比，幫助模型學(xué)習(xí)區(qū)分理想與不良輸出。這種設(shè)計(jì)使得Pico-Banana-400K能夠支持更復(fù)雜的編輯任務(wù)，并為模型訓(xùn)練提供更豐富的反饋信號。

盡管研究團(tuán)隊(duì)承認(rèn)Nanon-Banana模型在精細(xì)空間控制、布局外推和文字排版處理方面仍存在局限，但他們強(qiáng)調(diào)，Pico-Banana-400K的目標(biāo)是為下一代文本引導(dǎo)圖像編輯模型提供一個(gè)堅(jiān)實(shí)、可復(fù)現(xiàn)的基礎(chǔ)。通過公開這一資源，蘋果希望推動圖像編輯領(lǐng)域的技術(shù)進(jìn)步，并為研究人員提供更高效的工具，以應(yīng)對開放研究中的數(shù)據(jù)挑戰(zhàn)。

11-13

OPPO Reno15系列11月17日發(fā)布，Pro版配天璣8450、2億主攝及全息光刻工藝

11-13

V社連發(fā)三款重磅硬件！VR頭顯Steam Frame與迷你主機(jī)Steam Machine構(gòu)建游戲新生態(tài)

11-13

月映獅城夜：新加坡商人呂文揚(yáng)邂逅2025年最大超級月亮的靜謐時(shí)光

11-13

比亞迪堅(jiān)守磷酸鐵鋰：安全之外，刀片電池如何助其拓展市場想象空間？

11-13

小米在巴黎再拓版圖：首店為直營門店，高端化成歐洲核心戰(zhàn)略

11-13

清華大學(xué)團(tuán)隊(duì)革新視頻技術(shù)：多模態(tài)融合讓4K視頻生成更高效精準(zhǔn)

11-13

Bitmo Lab新推GameBaby手機(jī)殼，助iPhone 17 Pro Max秒變掌機(jī)重溫懷舊

11-13

小米米家App安卓端11.1.505.302體驗(yàn)版來襲，3D家居視圖開啟智能新體驗(yàn)

11-13

中國支付清算協(xié)會倡議：加強(qiáng)免密支付管理，提升用戶資金安全保障

11-13

蘋果聯(lián)名三宅一生推1299元織物袋，是情懷牌還是“智商稅”大考驗(yàn)？

11-13

智己LS9六座大型SUV上市：增程動力+超長續(xù)航，標(biāo)配空懸四輪轉(zhuǎn)向32.28萬起

11-13

從流水線女工到“果鏈女王”：周群飛攜藍(lán)思科技跨界突圍新賽道

11-12

螞蟻gPass技術(shù)再升級：虹膜核身支付亮相新加坡，開啟智能支付新體驗(yàn)

11-12

微信視頻通話隱藏玩法大揭秘：一鍵秒呼親友、分屏合照、默契自動接聽

11-12

點(diǎn)擊查看更多 +

全站最新

"千萬年薪挖角"落地！DeepSeek羅福莉朋友圈官宣加入小米大模型團(tuán)隊(duì)，共赴AGI未來

央視舞臺首秀！長安馬自達(dá)EZ-60攜頂級供應(yīng)鏈，繪就新能源全球化新畫卷

央視“第一發(fā)布”首迎車企！長安馬自達(dá)EZ-60攜硬實(shí)力，展中國智造全球風(fēng)采

景林香港公司2025年三季度持倉曝光：加倉科技與酒店股，新進(jìn)布局自動駕駛賽道

京津冀“鏈”動汽車產(chǎn)業(yè)：三地?cái)y手共進(jìn)，駛向協(xié)同發(fā)展新征程

比亞迪推出駕考版純電手動擋車型，為駕校省成本，手動擋或成稀罕物？

熱門內(nèi)容

本欄最新

跨越四分之一世紀(jì)：26年車齡、百萬公里的六代雅閣24小時(shí)耐力賽顯真章

比亞迪掀起價(jià)格風(fēng)暴：內(nèi)部競爭白熱化，夏以19.68萬重塑MPV市場格局

嵐圖夢想家10月蟬聯(lián)高端MPV銷冠，技術(shù)革新引領(lǐng)智能豪華出行新篇章

保時(shí)捷全新純電動Cayenne 19日首發(fā)，PPE平臺打造，800V架構(gòu)賦能

14.99萬開啟性能新篇：3.7秒四驅(qū)轎跑，東風(fēng)奕派讓夢想照進(jìn)現(xiàn)實(shí)

嵐圖夢想家：以核心技術(shù)破局，引領(lǐng)中國高端MPV邁向智能豪華新高度

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

蘋果推出Pico-Banana-400K數(shù)據(jù)集，為AI圖像編輯模型訓(xùn)練提供新助力