在更接近真实场景的MobileWorld测试集上,MAI-UI-235B-A22B整体成功率41.7%,比其他端到端模型高出20.8个百分点。在需要主动询问用户的任务上成功率37.5%,在需要调用MCP工具的任务上成功率51.1%,分别比之前最好的成绩高出32.1和18.7个百分点。
在12月初,豆包与中兴旗下的努比亚共同推出了AI手机“努比亚M153”,这一举动迅速成为互联网和AI领域的热议焦点。豆包手机的最大亮点在于其具备在用户授权下自动操作手机的能力,能够高效完成复杂的长链路任务。这一创新不仅引发了国内的广泛讨论,也让海外市场倍感震撼。
事实上,豆包手机助手引发的热议,已经产生了连锁反应。据手机供应链业内人士爆料,Google、OpenAI等互联网巨头目前已将GUI ...
此外,AI入口或许将重新改变硬件和软件生态的商业模式。在谈到和应用企业探索AI合作的未来商业模式变化时,姜昱辰表示,从功能机到智能机时代,手机企业的生态位是变好了,互联网收入或者渠道收入增多,到了AI时代,渠道收入预计仍会存在。“在和智能体探索合作,比如和支付宝的合作探索还在早期,甚至整个行业还处于早期,我们还在技术合作的阶段。” ...
凤凰网科技讯 12月29日,通义实验室多模态交互团队近日宣布开源其通用GUI智能体基座模型MAI-UI。该模型旨在通过理解屏幕界面并执行操作,完成跨应用、多步骤的复杂任务,例如查询车票、在通讯群组同步信息、调整会议安排等。
The way a person interacts and commands a computer, tablet, smartphone or other electronic device. The user interface (UI) comprises the screen menus and icons, keyboard shortcuts, mouse and gesture ...
通义实验室多模态交互团队近日正式对外发布并开源了一款名为MAI-UI的通用GUI智能体基座模型。这款模型的核心能力在于能够精准理解各类屏幕界面内容,并依据指令执行相应操作,从而完成跨应用、多步骤的复杂任务。例如,在出行场景中,它可以快速查询车票信息; ...
Last time, I assembled a Python object representing a Rigol oscilloscope. Manipulating the object communicates with the scope over the network. But my original goal was to build a little GUI window to ...