蘋(píng)果公司近日宣布,將派代表參加于2025年10月19日至23日在檀香山舉辦的國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV)。這一全球計(jì)算機(jī)視覺(jué)領(lǐng)域的頂級(jí)盛會(huì),每?jī)赡昱c歐洲計(jì)算機(jī)視覺(jué)會(huì)議(ECCV)交替舉行,致力于推動(dòng)該領(lǐng)域的前沿研究與技術(shù)發(fā)展。
據(jù)悉,蘋(píng)果此次參會(huì)陣容強(qiáng)大,不僅將提交八篇高質(zhì)量論文,還將在多個(gè)環(huán)節(jié)中深度參與。這些論文均經(jīng)過(guò)嚴(yán)格篩選,成功入選大會(huì)的海報(bào)展示與口頭報(bào)告環(huán)節(jié),內(nèi)容覆蓋計(jì)算機(jī)視覺(jué)領(lǐng)域的多個(gè)關(guān)鍵方向。
八篇論文的具體研究主題包括:ETVA模型通過(guò)細(xì)粒度問(wèn)答實(shí)現(xiàn)文本與視頻的精準(zhǔn)對(duì)齊評(píng)估;MM-Spatial項(xiàng)目探索多模態(tài)大語(yǔ)言模型對(duì)三維空間的理解機(jī)制;以及關(guān)于原生多模態(tài)模型擴(kuò)展規(guī)律的深入研究。研究還揭示了穩(wěn)定擴(kuò)散模型在視覺(jué)上下文學(xué)習(xí)中的隱性優(yōu)勢(shì),提出了STIV可擴(kuò)展的文本與圖像條件化視頻生成方法,并構(gòu)建了UINavBench交互式數(shù)字智能體綜合評(píng)估框架。其他成果還包括基于多模態(tài)提示的開(kāi)放世界分割技術(shù),以及UniVG通用擴(kuò)散模型在圖像生成與編輯領(lǐng)域的創(chuàng)新應(yīng)用。
在學(xué)術(shù)交流方面,蘋(píng)果機(jī)器學(xué)習(xí)應(yīng)用研究部經(jīng)理C. Thomas博士將作為主旨演講嘉賓出席第三屆基于視覺(jué)的工業(yè)檢測(cè)研討會(huì)(VISION)。其演講主題將于近期公布,具體時(shí)間定于10月19日。這場(chǎng)演講預(yù)計(jì)將引發(fā)業(yè)界對(duì)工業(yè)視覺(jué)檢測(cè)技術(shù)的深入討論。
除了技術(shù)展示與主旨演講,蘋(píng)果研究人員Patricia Vitoria Carrera與Tanya Glozman還將參與"計(jì)算機(jī)視覺(jué)領(lǐng)域女性研討會(huì)"的導(dǎo)師計(jì)劃。她們將在會(huì)后晚宴上與年輕學(xué)者展開(kāi)交流,分享研究經(jīng)驗(yàn)與職業(yè)發(fā)展建議。













