2025 AI进程之Phone use Agent
豆包手机助手是Phone use Agent突破性的尝试,完成度也较高,是对既有移动操作系统(OS)交互逻辑与流量分配权力的一次深度试探(基于底层大模型能力)。
AutoGLM去年10月发布第一个能够在真机上稳定完成一条完整操作链路的Phone use AI Agent, AutoGLM 2.0扩展了准确性和泛化能力并于近期开源,硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。
展望未来,移动互联网生态会不会从由“App为中心”向“智能体(Agent)为中心” 的范式转移?微信AI智能体(构想)、豆包手机助手、AutoGLM所代表的系统级AI Agent成为行业未来的关注重点。而底层大模型能力,特别是在实时语音交互、混合专家架构优化以及多模态推理能力上的深度积累,对端侧应用场景中推理成本与交互时延的精准控制显得愈发重要。#一个想法不一定对