即刻App年轻人的同好社区
下载
App内打开
Simon的白日梦
2年前
可以帮你操作手机的agent助手,可以接API也可以端侧运行(感觉水军狂喜了……😂)
GitHub - X-PLUG/MobileAgent

🧐MobileAgent是一个功能强大的移动设备操作助手家族,支持多模态操作,具备视觉感知能力,能通过多代理协作实现高效导航和自动化操作。

➡️链接:github.com

✨重点

**功能特点**
●📱 **MobileAgent-v2**:这是移动设备操作助手的最新版本,通过多代理协作实现高效导航。支持安卓和iOS设备。
●👁️ **视觉感知**:MobileAgent具有自主多模态操作能力,能通过视觉感知实现更智能的设备操作。
●🤖 **自动化操作**:可以自动化执行多种移动设备操作,如应用程序的打开和使用、界面导航等。

**应用场景**
●🔧 **研究和开发**:适用于学术研究和应用开发,用户可以基于该项目进行定制和扩展。
●📈 **自动化测试**:可用于移动应用的自动化测试,减少人力投入,提高测试效率。

**技术背景**
●📄 **学术支持**:MobileAgent已被ICLR 2024的大型语言模型代理研讨会接受,并在arXiv上发布了相关论文。
●📊 **多模态大语言模型**:项目关联了多个多模态大语言模型,如mPLUG-Owl和Qwen-VL,展示了其在理解、定位、文本读取等方面的强大能力。

**资源与文档**
●📄 **文档**:提供详细的使用说明和技术文档,帮助用户快速上手。
●📜 **开源许可**:项目采用MIT许可,开源免费使用。

通过这一项目,研究人员和开发者可以探索和实现更智能、更高效的移动设备操作和自动化解决方案。
02:05
019

来自圈子

圈子图片

人工智能讨论组

474750人已经加入