即刻App年轻人的同好社区
下载
App内打开
MLOasis
74关注121被关注0夸夸
机器学习&数据科学
Talk is cheap, Do something.
博客:mloasisblog.com
公众号:MLOasis
MLOasis
2天前
clawdbot 就是一个拥有完全系统权限,且能用 claude code claude code 吧。
00
MLOasis
6天前
00
MLOasis
9天前
成功的 Agent 应用都在“结构化反馈”上做文章,把自动化质量与正确性检查嵌入工具链,让 LLM 在较长任务里持续校正。若只给 Agent 文件编辑权限、缺少构建与运行渠道,工程师就要充当人工反馈回路,浪费自己的“back pressure”;相反,提供 bash/构建、测试与可执行环境,Agent 能读错误并自我修复,工程师释放精力去关注更高层目标。

类型系统与优质错误信息也是有效 back pressure。Rust、Elm、Python 的清晰报错能直接喂给 LLM,类型约束让“非法状态不可表示”,帮助 Agent 更快对齐边界与契约。前端场景可用 MCP server Playwright Chrome DevTools,让 Agent渲染页面、比对预期与结果,减少人类口头验收;非 UI 场景用 MCP LSP、lint、静态分析同理。

更广泛地,Lean 等证明助手结合 AI、随机化 fuzzing 验证(如生成 CUDA kernel 的正确性)、逻辑编程与“agent-as-a-judge”式评估,都是把外部严格性转化为可迭代反馈,持续“拉动拉杆”直至可靠解。

作者判断:投资更高质量测试与反馈基建的回报快速增长,工程工作将越来越像“设计 back pressure、扩张 Agent 贡献的接纳率”。

实践上,做 spec‑driven development 时,可将 OpenAPI 文档自动生成并与 Agent 输出对比;给 Agent 配全套运行、测试、静态分析、渲染与观察工具,再用循环策略“loop agents”持续消除不一致与缺陷。核心问题是:你是否在浪费自己的 back pressure,还是把它转化为系统化、自动化的反馈,使 Agent 能在更长的时间尺度上可靠前进。

Don't waste your back pressure ·

00
MLOasis
10天前
书不用一本一本的看,可以挑你喜欢的那部分内容看,不用说完整看完才换另一本。

播客也不用一定要听完一期才换另外一期,可以按不同场景换听不同类型的播客,听不完一期就下次再听。

运动也不用纠结一定要带着手表记录下数据,没带表运动一两天也没关系,我的身体是真的有在锻炼。
00
MLOasis
17天前
cursor 的内嵌网页功能使得用户可以直接在 IDE 中打开网页,同时可以选中前端页面的各种元素和组件,这样模型能直接感知到 GUI 的上下文,再加上新出的 debug 模式,这样的组合还是很有竞争力的,至少相比用 claude code 每次开发前端页面只能靠截图来的便捷。

人机交互还是有价值的,应用层在上下文和交互上还是有空间发挥的,但是真的只能不断快速奔跑,在这场模型厂商与应用初创公司的大逃杀中,快才是应用层的护城河吧😂

只能说强度真的好大...
00
MLOasis
17天前
有些人嘴上说着很多大道理,但没怎么看到他做对一件非共识的事。
00
MLOasis
18天前
如果看到“太好了!”、“很好!”或者“完美!”这些短语,那说明基本上就是出自 Claude 了😂
00
MLOasis
18天前
Cursor Agent 编码最佳实践(精简版)

一、核心理念

Cursor 的 Agent 由 Instructions(规则)+ Tools(工具)+ User Messages(指令) 组成。Agent 不是“自动写代码机器”,而是需要被清晰引导的协作型工程助手,不同模型在相同指令下表现可能不同。



二、先规划,再执行(最重要)

优先使用 Plan Mode(Shift+Tab):
• Agent 会先分析代码库、提出澄清问题、生成可审查的实现计划
• 计划是可编辑的 Markdown,可保存复用
• 调整计划比事后反复改代码更高效
• 简单、明确的小任务可直接跳过规划



三、上下文管理原则
• 让 Agent 自行检索上下文:通过语义搜索和 grep 自动找相关代码
• 只有在你明确知道关键文件时才手动指定
• 避免塞入无关信息,防止噪音干扰
• 任务切换或 Agent 明显跑偏时,开启新对话
• 使用 @PAST Chats 引用历史,而非复制粘贴



四、Rules 与 Skills

Rules(静态规则)
• 存在 .cursor/rules/
• 只写关键约束:构建方式、测试命令、编码规范、常见错误
• 规则应短、稳定、可版本化,适合团队共享

Skills(工作流能力)
• 封装常用任务和自动化流程
• 如:运行测试直到通过、UI 迭代、集成外部系统
• 本质是让 Agent 学会“怎么干活”,而不仅是“写代码”



五、图像也是上下文

Agent 可直接理解截图、设计稿:
• 从设计稿生成 UI
• 通过错误截图进行可视化调试
• 比纯文字描述更高效



六、高效工作流模式

TDD 模式
1. 先写测试
2. 确认测试失败
3. 再实现代码
4. 直到测试通过
→ 为 Agent 提供明确、可验证目标

代码理解
• 直接提问模块职责、数据流、设计动机
• Agent 会自动定位相关代码并解释

Git 自动化
• 自动建分支、提交、提 PR
• 将常用流程沉淀为可复用命令



七、质量保障
• 实时观察 Diff,必要时中断
• 使用 Agent Review 查问题
• PR 后用 Bugbot 自动审查
• 复杂逻辑可让 Agent 生成架构图辅助评审



八、并行与多 Agent
• 支持 Git worktree,多 Agent 并行尝试不同方案
• 可对同一任务用多个模型对比结果,择优合并



九、云端 Agent 与 Debug
• 云端 Agent 可异步处理修复、重构、测试、文档
• Debug 模式适合复杂问题:提出假设、加日志、复现、定位并修复



十、总体原则
• 明确目标 + 可验证机制
• 人始终负责决策与审查
• 从简单开始,逐步沉淀规则和流程
• 把 Agent 当“高级工程协作者”,而不是替代品

Cursor Agent 最佳实践

00
MLOasis
22天前
00
MLOasis
22天前
00