近日,中文語言理解領(lǐng)域權(quán)威測評基準(zhǔn)SuperCLUE發(fā)布第二期手機(jī)GUI Agent(離線)測評報(bào)告,中興通訊自主研發(fā)的Nebula-GUI-V2憑借92.27的高分強(qiáng)勢登頂總榜。Nebul-GUI是中興通訊星云大模型家族的一員,主要用于各類GUI界面自主操作,在UI元素定位與指令執(zhí)行兩大核心能力上表現(xiàn)突出,以絕對優(yōu)勢領(lǐng)跑行業(yè),彰顯了中興通訊在AI智能交互領(lǐng)域的深厚技術(shù)積淀與創(chuàng)新實(shí)力。

SuperCLUE本次測評在首期基礎(chǔ)上全面升級,新增"智慧辦公""生活健康"等實(shí)用場景,并引入20步左右跨應(yīng)用困難題,從多維度、全場景精準(zhǔn)衡量手機(jī)端離線智能交互水平。本次共有國內(nèi)外12個代表性智能體產(chǎn)品參與角逐,測評結(jié)果的權(quán)威性和參考價值也因此得到進(jìn)一步提升,為行業(yè)提供了更為清晰的發(fā)展標(biāo)桿。
在核心能力測評中,中興Nebula-GUI-V2展現(xiàn)出均衡且卓越的綜合實(shí)力。其中,在UI元素定位環(huán)節(jié)以98.40分的高分刷新紀(jì)錄,展現(xiàn)出對屏幕目標(biāo)元素的精準(zhǔn)識別與定位能力;指令執(zhí)行環(huán)節(jié)同樣表現(xiàn)亮眼,以88.18分位列第一,在視頻娛樂、音樂播放、交通導(dǎo)航、健康管理、辦公協(xié)作等九大核心場景中均取得優(yōu)異成績,其中健康管理場景得分高達(dá)94.00分,辦公協(xié)作場景89.10分,充分體現(xiàn)了產(chǎn)品對用戶多樣化需求的深度適配。

尤為值得關(guān)注的是,Nebula-GUI-V2在跨應(yīng)用復(fù)雜任務(wù)中表現(xiàn)突出,憑借高效的指令理解能力和精準(zhǔn)的操作執(zhí)行邏輯,順利攻克各類高難度場景任務(wù),其任務(wù)完成度、動作類型準(zhǔn)確率及動作細(xì)節(jié)匹配率均處于行業(yè)頂尖水平。這一成果背后,是中興通訊在人工智能、計(jì)算機(jī)視覺、自然語言處理等領(lǐng)域的持續(xù)技術(shù)投入與創(chuàng)新突破,通過優(yōu)化模型架構(gòu)與算法邏輯,實(shí)現(xiàn)了智能交互體驗(yàn)的跨越式提升。

GUI Agent作為手機(jī)端聚合服務(wù)的AI“超級入口”,正成為行業(yè)競爭的新焦點(diǎn)。它憑借重塑流量分發(fā)格局的潛力,不僅催生千億級市場機(jī)遇,更吸引諸多頭部科技企業(yè)紛紛布局。此次登頂SuperCLUE測評,是中興通訊AI技術(shù)創(chuàng)新成果的又一重要體現(xiàn)。隨著智能終端交互需求的不斷升級,中興通訊將繼續(xù)以用戶需求為中心,持續(xù)迭代優(yōu)化產(chǎn)品能力,為全球用戶提供更智能、更便捷、更高效的交互體驗(yàn),助力AI技術(shù)走進(jìn)千家萬戶。
-金年會體育