全球知名人工智能學(xué)者許主洪(Steven Hoi)已確認加入阿里巴巴集團,擔(dān)任智能信息事業(yè)群首席科學(xué)家兼集團副總裁。這位擁有二十余年產(chǎn)學(xué)研經(jīng)驗的IEEE Fellow,此前曾在新加坡管理大學(xué)擔(dān)任終身教授,并在南洋理工大學(xué)獲得終身副教授職位,其學(xué)術(shù)成果被國際學(xué)術(shù)界廣泛認可,累計發(fā)表三百余篇頂級論文,引用量突破五萬次,多次入選斯坦福大學(xué)發(fā)布的全球頂尖科學(xué)家榜單。
作為多模態(tài)人工智能領(lǐng)域的權(quán)威專家,許主洪的職業(yè)生涯橫跨學(xué)術(shù)研究與產(chǎn)業(yè)實踐。他曾在企業(yè)軟件巨頭Salesforce擔(dān)任亞洲區(qū)副總裁,主導(dǎo)構(gòu)建了該公司在亞太地區(qū)的AI研發(fā)體系。2023年創(chuàng)立的多模態(tài)AI公司HyperAGI,進一步印證了其在技術(shù)轉(zhuǎn)化與商業(yè)落地方面的雙重能力。這種獨特的復(fù)合背景,使其成為當前人工智能領(lǐng)域極為稀缺的復(fù)合型人才。
據(jù)內(nèi)部人士透露,許主洪今年初加入阿里后,最初負責(zé)面向消費級市場的AI產(chǎn)品研發(fā),統(tǒng)籌通義應(yīng)用、夸克搜索及天貓精靈等核心業(yè)務(wù)的算法團隊。在六月上海世界移動通信大會上,他以夸克App的AI超級框和智能相機功能為例,系統(tǒng)闡釋了多模態(tài)技術(shù)在消費場景的應(yīng)用路徑,其提出的"全模態(tài)交互"理念引發(fā)行業(yè)關(guān)注。
近期行業(yè)動態(tài)顯示,這位技術(shù)領(lǐng)軍者的研究方向出現(xiàn)重要調(diào)整。最新消息表明,許主洪已轉(zhuǎn)任通義實驗室核心團隊,將專注于基礎(chǔ)大模型研發(fā)工作。這一變動恰逢阿里云智能集團CTO周靖人在云棲大會上強調(diào)"模型迭代效率競爭"的關(guān)鍵時期,凸顯出企業(yè)在多模態(tài)技術(shù)領(lǐng)域的戰(zhàn)略布局升級。
在五月螞蟻集團技術(shù)開放日活動中,許主洪曾深入剖析多模態(tài)大模型的發(fā)展瓶頸。他指出當前技術(shù)面臨兩大核心挑戰(zhàn):一是全模態(tài)交互的統(tǒng)一框架尚未成熟,支持文本、圖像、語音、視頻協(xié)同處理的公開模型極為稀缺;二是理解與生成的平衡難題,現(xiàn)有模型在語義理解與內(nèi)容生成的綜合表現(xiàn)仍存在顯著短板。這些技術(shù)洞察,與其新崗位的研發(fā)方向形成高度契合。
針對多模態(tài)智能體(Agent)的未來發(fā)展,許主洪在六月演講中提出,當前行業(yè)仍處于初級階段,要實現(xiàn)通用人工智能(AGI)需要突破基礎(chǔ)模型能力、智能體核心模塊、數(shù)字世界連接及物理世界交互等多重技術(shù)壁壘。這種前瞻性判斷,或許正是阿里巴巴將其調(diào)任基礎(chǔ)研究崗位的重要考量。
截至發(fā)稿前,阿里巴巴集團及許主洪本人均未對職務(wù)調(diào)整事宜作出正式回應(yīng)。但行業(yè)觀察人士指出,這位技術(shù)領(lǐng)袖的轉(zhuǎn)型,標志著中國科技企業(yè)在人工智能基礎(chǔ)研究領(lǐng)域持續(xù)加大投入,多模態(tài)大模型的競爭格局可能因此產(chǎn)生新的變量。











