滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 手機(jī)快報(bào) > 正文內(nèi)容

蘋果推出Pico-Banana-400K數(shù)據(jù)集，為AI圖像編輯模型訓(xùn)練提供新助力

時(shí)間：2025-10-29 14:55:19 來源：快訊編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

蘋果公司近日發(fā)布了一項(xiàng)重要研究成果——名為《Pico-Banana-400K：面向文本引導(dǎo)圖像編輯的大規(guī)模數(shù)據(jù)集》的全新數(shù)據(jù)集。該數(shù)據(jù)集包含40萬張經(jīng)過精心編輯的圖像，旨在為文本引導(dǎo)的圖像編輯模型提供高質(zhì)量的訓(xùn)練和評(píng)測(cè)資源。與以往數(shù)據(jù)集不同，Pico-Banana-400K采用非商業(yè)性研究許可發(fā)布，允許全球研究人員和學(xué)術(shù)機(jī)構(gòu)自由使用，但禁止用于商業(yè)用途。

近年來，圖像生成與編輯技術(shù)取得了顯著進(jìn)展，但開放研究仍面臨諸多挑戰(zhàn)。蘋果研究團(tuán)隊(duì)指出，現(xiàn)有數(shù)據(jù)集普遍存在三大問題：一是依賴專有模型生成的合成數(shù)據(jù)，二是僅包含有限的人工篩選子集，三是存在領(lǐng)域偏移、編輯類型分布不均以及質(zhì)量控制不一致等問題。這些問題嚴(yán)重制約了魯棒圖像編輯模型的發(fā)展。為突破這一瓶頸，蘋果團(tuán)隊(duì)決定構(gòu)建一個(gè)更全面、更具代表性的圖像編輯數(shù)據(jù)集。

Pico-Banana-400K的構(gòu)建過程嚴(yán)謹(jǐn)而系統(tǒng)。研究團(tuán)隊(duì)首先從OpenImages數(shù)據(jù)集中精選了大量真實(shí)照片，確保內(nèi)容涵蓋人物、物體及含文字場(chǎng)景等多樣化元素。隨后，他們?cè)O(shè)計(jì)了35種不同類型的圖像修改指令，并將其歸入八大類別，包括像素與光度調(diào)整（如添加復(fù)古濾鏡）、以人為中心的編輯（如將人物轉(zhuǎn)換為玩具形象）、場(chǎng)景構(gòu)成與多主體編輯（如改變天氣條件）、對(duì)象級(jí)語義修改（如移動(dòng)物體位置）以及圖像縮放（如放大畫面）等。

在編輯過程中，研究人員將原始圖像與編輯指令輸入谷歌的Gemini 2.5-Flash-Image模型（也被稱為Nanon-Banana）進(jìn)行圖像編輯。該模型在圖像編輯任務(wù)中表現(xiàn)出色，被廣泛認(rèn)為是當(dāng)前最先進(jìn)的模型之一。生成結(jié)果隨后交由Gemini 2.5-Pro模型進(jìn)行自動(dòng)評(píng)估，只有準(zhǔn)確遵循指令且具備良好視覺質(zhì)量的圖像才會(huì)被納入最終數(shù)據(jù)集。這一雙重驗(yàn)證機(jī)制確保了數(shù)據(jù)集的高質(zhì)量。

Pico-Banana-400K不僅包含單輪編輯的樣本，還涵蓋了多輪連續(xù)編輯序列以及“偏好對(duì)”樣本。后者通過對(duì)比成功與失敗的編輯結(jié)果，幫助模型學(xué)習(xí)區(qū)分理想與不良輸出。這種設(shè)計(jì)使得數(shù)據(jù)集更具實(shí)用性和訓(xùn)練價(jià)值。盡管研究團(tuán)隊(duì)承認(rèn)Nanon-Banana在精細(xì)空間控制、布局外推和文字排版處理方面仍存在局限，但他們強(qiáng)調(diào)，Pico-Banana-400K的目標(biāo)是為下一代文本引導(dǎo)圖像編輯模型提供一個(gè)堅(jiān)實(shí)、可復(fù)現(xiàn)的基礎(chǔ)。

目前，相關(guān)研究論文已發(fā)布于預(yù)印本平臺(tái)arXiv，完整的Pico-Banana-400K數(shù)據(jù)集也已在GitHub上向全球研究者免費(fèi)開放。這一舉措有望推動(dòng)圖像編輯領(lǐng)域的研究進(jìn)展，為開發(fā)更智能、更高效的圖像編輯工具奠定基礎(chǔ)。

更多>同類資訊

深海2000米：機(jī)器人帶回神秘樣本，解鎖生命“暗物質(zhì)”密碼

以黑珊瑚為例，其骨骼含有一種“溴代酪氨酸”衍生物，在實(shí)驗(yàn)室里能選擇性抑制某些癌細(xì)胞線粒體呼吸，卻對(duì)正常細(xì)胞影響甚微；透明海蜘蛛的固氮系統(tǒng)，或許能幫我們?cè)O(shè)計(jì)“零肥料”垂直農(nóng)場(chǎng)；而那些吃巖石的微生物，分泌的胞外多…

10-29

微信AI機(jī)器人部署指南：一鍵部署可行性、流程、耗時(shí)及優(yōu)化全解析

此外，ChatWave等系統(tǒng)還提供了詳細(xì)的安裝指南和在線支持，幫助用戶在遇到問題時(shí)能夠迅速解決。選擇一個(gè)提供一鍵部署功能的系統(tǒng)，如ChatWave，可以顯著提高部署的成功率和用戶體驗(yàn)。如果用戶的設(shè)備配置較低，…

10-29

蘋果新iPad mini防水性能升級(jí) 或配OLED屏預(yù)計(jì)2026年登場(chǎng)且售價(jià)或漲

10-29

蘋果iPhone固態(tài)按鍵方案通過驗(yàn)證，2027年iPhone 20或率先搭載實(shí)現(xiàn)功能升級(jí)

10-29

蘋果2026款iPad mini或迎升級(jí)：防水向iPhone看齊還將首用OLED屏

10-29

Spigen Zero:One系列配件登場(chǎng)，iPhone 17無需改裝盡覽內(nèi)部精密之美

10-29

聚焦游戲體驗(yàn)，一加15“硬核”出擊，精準(zhǔn)鎖定年輕玩家市場(chǎng)

10-29

蘋果推出Pico-Banana-400K數(shù)據(jù)集，為AI圖像編輯模型訓(xùn)練提供新助力

10-29

華為Mate 70 Air海報(bào)曝光：圓形鏡頭+輕薄機(jī)身，或月底登場(chǎng)引期待

10-29

銀發(fā)族打破刻板印象：互聯(lián)網(wǎng)上“沖浪” 消費(fèi)休閑盡顯新活力

根據(jù)中國(guó)人民大學(xué)人口與發(fā)展研究中心和北京大學(xué)未來城市研究中心聯(lián)合發(fā)布的《從線上到線下：老年人短視頻使用與線下社會(huì)參與報(bào)告》顯示，在使用短視頻App的老年人中，約90%平均每天觀看總時(shí)長(zhǎng)在2小時(shí)以內(nèi)。京東《…

10-29

蘋果iPhone 18相機(jī)控制按鈕或簡(jiǎn)化設(shè)計(jì)：移除電容層，保留壓力感應(yīng)

10-29

一加15原色沙丘：十年堅(jiān)守，在細(xì)節(jié)中續(xù)寫“不將就”的傳奇

10-29

排隊(duì)免單新策略：如何讓私域電商跳出價(jià)格戰(zhàn)，實(shí)現(xiàn)復(fù)購(gòu)率與客單價(jià)雙提升

一種名為「排隊(duì)免單」的模式，正在讓一批商家跳出價(jià)格戰(zhàn)泥潭：某美妝集合店上線該模式30天，復(fù)購(gòu)率提升240%，客單價(jià)提升57%；某零食品牌憑借此模式，單月通過私域裂變新增8000+精準(zhǔn)客戶。它的精妙在于…

10-29

國(guó)海證券原固收首席靳毅回應(yīng)“炒黃金期貨賺14億”：系假消息已報(bào)警

10-29

XREAL上海浦東全球總部啟用，攜手谷歌明年推Android XR系統(tǒng)AR眼鏡

10-28

點(diǎn)擊查看更多 +

全站最新

29.98萬元起！騰勢(shì)N8L上市，以“三超”實(shí)力打造家庭豪華出行新體驗(yàn)

29.98萬元起！騰勢(shì)N8L攜“超安全、超豪華、超智能”登場(chǎng)，重塑家庭大六座SUV新體驗(yàn)

29.98萬元起！騰勢(shì)N8L攜“超安全超豪華超智能”登場(chǎng)，重塑家庭大六座SUV新體驗(yàn)

雷軍領(lǐng)銜小米汽車架構(gòu)部，定調(diào)未來技術(shù)方向或影響2030年市場(chǎng)格局

小米SU7 Ultra“前艙升級(jí)”引爭(zhēng)議，新增倆葉片難消維權(quán)準(zhǔn)車主疑慮

小米汽車要逆襲？多機(jī)構(gòu)研報(bào)預(yù)測(cè)Q3將扭虧為盈，盈利或超7億元

熱門內(nèi)容

本欄最新

王騰遺憾未參與K90上市，網(wǎng)友熱情力挺：為“騰哥”買單K90系列

REDMI K90系列登場(chǎng)：雙芯強(qiáng)性能、超級(jí)像素屏、BOSE聲學(xué)，全能旗艦新標(biāo)桿

亞馬遜攜手Also推TM-Q助力貨運(yùn)四輪車，模塊化設(shè)計(jì)開啟城市物流新篇

博主透露某廠商手機(jī)激活量達(dá)百萬或是小米17系列銷量增長(zhǎng)顯著

庫(kù)克發(fā)文悼念喬布斯：其信念如光照亮前路，激勵(lì)眾人奮進(jìn)14載

盧偉冰微博發(fā)聲：小米17系列銷量破百萬，正加緊生產(chǎn)備貨

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

国产精品三级视频_欧美日韩一区二区在线_亚洲国产精品久久久久秋霞蜜臀_国产在线视频2019最新视频_97香蕉久久超级碰碰高清版_亚洲午夜一区二区_制服丝袜亚洲网站_美女av一区二区三区_欧美壮男野外gaytube_欧美日韩一级二级

蘋果推出Pico-Banana-400K數(shù)據(jù)集，為AI圖像編輯模型訓(xùn)練提供新助力