鳳凰網(wǎng)科技訊 12月3日 在國際殘疾人日之際,杭州瞳行科技正式發(fā)布了國內(nèi)首款基于多模態(tài)大模型的AI助盲眼鏡。該產(chǎn)品接入了通義千問Qwen-VL及OCR系列模型,旨在通過“視覺模型+硬件”的組合,解決視障群體在出行導(dǎo)航中經(jīng)常面臨的“最后十米”尋址難題。
該助盲眼鏡硬件端配備了121度超廣角雙攝像頭,整體套件由眼鏡主體、手機(jī)、遙控指環(huán)及盲杖四部分構(gòu)成。在核心的算力與算法層面,技術(shù)團(tuán)隊針對不同使用場景進(jìn)行了模型調(diào)優(yōu):在移動避障場景下,系統(tǒng)可實現(xiàn)300ms的超低延遲,即用戶每邁出一步,眼鏡即可完成一次環(huán)境分析與道路提示,僅對路牌、車輛等關(guān)鍵障礙物進(jìn)行簡要概括;而在閱讀菜單或?qū)ふ业赇伒葓鼍爸校竽P蛣t會切換策略,對文本和環(huán)境細(xì)節(jié)進(jìn)行詳細(xì)總結(jié)與播報。
據(jù)統(tǒng)計,我國現(xiàn)有視障人士超1700萬,由于缺乏除盲杖以外的高效輔助工具,出行高度依賴人工,導(dǎo)致許多視障者選擇“少出行”。杭州瞳行科技市場及技術(shù)總監(jiān)陳剛表示,大模型技術(shù)為行業(yè)帶來了轉(zhuǎn)機(jī),算力成本已降至此前的十分之一。通過“基模復(fù)用+微調(diào)優(yōu)化”的技術(shù)路徑,企業(yè)能以更低的門檻快速實現(xiàn)包括語音助手、一鍵求助親友在內(nèi)的復(fù)雜功能。目前,該款A(yù)I助盲眼鏡已正式面市。











