阶跃星辰开源4B模子,土产货轻便部署,在你的手机上马上跑GUI任务!
新民晚报记者今天从大模子独角兽阶跃星辰获悉,其于11月29日开源GELab-Zero,初度将GUI Agent模子与完好意思配套基建同步绽开,因循“手搓党”一键部署。其中4B GUI Agent模子在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模子性能记载,取得SOTA(来源进水平)得益。此外,阶跃星辰还开源了基于信得过业务场景的自建评测规范AndroidDaily,以期鼓动GUI边界模子评测向花费级、范围化运用发展。现在,企业级用户和开导者照旧不错通过GitHub和HuggingFace平台体验GELab-Zero。
阶跃星辰在ScreenSpot、OSWorld、MMBench、Android World多个开源基准测试上对GELab-Zero-4B-preview模子进行了全面评估,涵盖了GUI明白、定位、交互等多个维度。测试成果透露,GELab-Zero-4B-preview在多项巨擘开源基准测试中特出其他主流模子,拿下同尺寸SOTA。同期,GELab-Zero-4B-preview的说明还特出了参数目更大的GUI-Owl-32B等模子,性能更优也更易部署。


阶跃星辰官方先容,GELab-Zero提供一键拉起即可获取不异开源GUI Agent MCP的体验,在土产货即可完成部署,并将推理链路满盈掌控在我方手里。就具体才能而言,GELab-Zero可因循4B量级模子在花费级硬件上开动,兼顾低延长与阴私;与此同期,它还因循一键式多末端部署,能自动处理环境依赖和建树经管;不错分发到多台手机并记录交互轨迹,完了可不雅测、可复现;并因循多模态智能体范式:涵盖ReAct闭环、多智能体调解以及定时任务等多种职责口头。

在官方公布的运用场景示例中,GELab-Zero不错很好地引申复杂任务和污秽教唆,比喻概况精确地完成一次跨品类、触及不同商品规格和数目的采购,也不错在接到“经典电影”“适应遛娃的场地”这类污秽和有主不雅颜色的需求时,自行判断引申规范并凯旋完成任务。
据了解,阶跃星辰研发GELab-Zero的初志,是处理GUI Agent濒临的诸多工程侧贫乏——由于迁徙端运用生态极其碎屑化,GUI Agent在不同品牌、型号建树上开动时场景会在多建树ADB贯穿、依赖装置、权限配置、推理干事上线、任务编排与回放等方面出现工程问题,这意味着Agent开导者与MCP用户需要处理诸多工程基建职责,难以将元气心灵靠拢于计谋翻新。
此前,阶跃星辰曾在2025寰球东说念主工智能大会时分公开展示了“一键引申助手”AI手机处理决议。接入该决议后,手机Agent助手不错基于用户教唆自主引申包括追星打卡、点外卖、预约挂号、舆图导航、交纳社保、预订机票酒店、写一又友圈案牍等各式任务,让手机Agent助手的才能从“能对话”延展到“会干活”,进一步成为东说念主类智谋伴生体。