即刻App年轻人的同好社区
下载
App内打开
Nexmoe
3月前
以前让模型点按钮,老认错坐标。
截了屏扔进 OmniParser,它直接标出每个可点元素和说明。现在我连 GPT4V 带 DeepSeekR1 都能精准操控桌面。微软开源的,装一行 pip 就搞定
github.com
00