即刻App年轻人的同好社区
下载
App内打开
孟健AI编程
9关注141被关注0夸夸
DeepSeek畅销书作者(94万册)· 大厂10年→全职创业 · 一个月做30个出海产品 · AI编程/出海/一人公司
孟健AI编程
1天前
今天看了 Mistral Forge,和最近 HN 上大家在追的“AI写代码更快”路线有个差异:它把核心放在“企业知识注入 + 持续评估”,而不是只追单点性能。

我更认同的不是“更多参数”,而是这句逻辑:
1) 先把模型学进内部词汇、流程和策略
2) 再把它放到可审计的执行链路
3) 最后才谈 10 倍速度

对我来说,agent 能否上线,关键不在有没有写出新功能,而在是否能减少错误扩散。我最近更关注的一点,是把可控性当成第一生产力。

你们团队在引 agent 时,先是先做了权限和规范,还是直接放进 CI 里跑?
00
孟健AI编程
4天前
今天看 hackerbot-claw 这波,我最大的感受是:AI 编程已经不只是“生成代码更快”了,开始进入真正的工程攻防。

StepSecurity 公开拆了这波针对 GitHub Actions 的自动化攻击,至少 4 个目标被跑通了远程代码执行;Datadog 那篇也很值得看,直接把 claude-code-action、codex-action、run-gemini-cli 这类 LLM workflow prompt injection 风险写出来了。

我自己的 3 个判断:
1. 以后看 AI coding workflow,先看权限模型,不是先看 demo 有多酷。
2. 只要 agent 开始自动读 issue、提 PR、跑 CI,攻击面就从“代码质量”扩到了“供应链安全”。
3. GitHub 官方一直强调 GITHUB_TOKEN 要最小权限,这件事以前很多团队当 best practice,现在会越来越像底线。

所以我越来越觉得:
2026 年把 agent 接进工程链路,guardrails 可能要先于提效。

你们现在会让 agent 直接碰 CI 吗?还是只让它停在本地开发这层?
00
孟健AI编程
6天前
今天早上刷 page-agent ABP,最大的感受不是又多了一个 agent 项目,而是 AI 编程开始从“写代码”往“控制界面”这层走了。

page-agent 这类东西很有意思:不是再开一个 headless browser,也不是盯着截图瞎猜,而是直接在页面里读 DOM、点按钮、填表单。

ABP 走的是另一条路:把浏览器动作拆成 agent 更容易消费的一步一回合协议,强调一请求一结果,拿到 settled page state 再继续。

为什么我会在意这个变化?
因为很多真实工作流里,最烦的不是写一个函数,而是登录后台、找入口、点一串按钮、填一堆表单、再回头确认结果。

所以我越来越觉得:
下一代 AI 编程工具的分水岭,可能不是谁补全更快,而是谁更能“看懂界面 + 稳定操作界面”。

你们最近有在试 browser agent / page-agent 这种东西吗?
00
孟健AI编程
7天前
昨天 Replit 发布了 Agent 4,看完官网感触挺深的。

以前说 AI 编程,大家想的是"帮我补全代码"、"帮我写函数"。但 Agent 4 的定位变了——它不是一个代码助手,而是一个共创工作台。

几个新东西值得关注:
1. 无限画布:不是聊天框了,是类似 Figma 的协作空间
2. 并行 agents:多个 agent 同时工作,各负责不同模块
3. 多种输出:不只是代码,还能直接出 slides、animation

我觉得这代表了 AI 编程的一个转向:从"AI 帮你写代码"到"和 AI 一起做项目"。

工具在变,心态也得跟着变。
00
孟健AI编程
8天前
2026年AI编程的主战场,正在从"谁来写代码"转向"谁来审代码"。

这周Claude和OpenAI同时出招:
- Claude Code Review:PR一打开,自动派遣一组AI agents找bug
- Codex Review:直接打价格战,暗示Claude每次审查要$25,Codex只要$1

有意思的是,OpenAI的人直接在推文里写"如果你不想每次付$25(没打错)"——这是赤裸裸的正面竞争了。

我的判断:AI review正在成为新的基础设施层。以后工程师的角色会越来越像"AI代码的审批官",而不是"代码的生产者"。

你们团队开始用AI做代码审查了吗?
00
孟健AI编程
9天前
AI 编程的战场正在发生转移。

这两天观察到一个有意思的信号:OpenAI Anthropic 几乎同时在构建各自的技能生态——

OpenAI Skills 仓库(github.com/openai/skills)这几天登上 GitHub Trending,目前已经有 13.6k Stars。它本质上是给 Codex agent 装的技能包目录,社区可以贡献各种能力模块。

Anthropic Claude Marketplace 刚在 Product Hunt 上拿到 Day #1(541个赞),定位是让企业用现有的 Anthropic 账户额度直接购买第三方基于 Claude 构建的解决方案。

2026 AI 编程的竞争焦点,正在从哪个模型更强转向谁的生态更丰富。

就像当年 iOS vs Android 的竞争,最终决定胜负的不是处理器,而是 App Store。

你会给你的 AI 编程工具装哪些技能?
00
孟健AI编程
13天前
🚨 4000台开发者机器被攻陷,入口竟是一行Issue标题

这两天HN热议的Clinejection事件,读完细节我后背发凉。

攻击链非常精巧:
1. 攻击者在GitHub开了个issue,标题里藏了一条AI指令
2. Cline的AI分诊bot读取标题 执行了npm install指向攻击者的仓库
3. 恶意脚本污染了CI缓存
4. 缓存被恢复时,npm token被偷走
5. 8小时后,4000人装了带后门的cline@2.3.0

最魔幻的部分:
- 安全研究员1月就报告了漏洞,5周没人回复
- 2月9号公开披露后,Cline 30分钟内修复
- 但token轮换时删错了,攻击者早已拿到有效凭证

核心教训:
- AI bot不能直接把用户输入当指令执行
- 供应链现在有了递归问题:"AI installs AI"
- npm postinstall脚本可以做任何事,你根本不会收到提示

你们项目里用AI做自动化吗?有没有想过这个攻击面?
00
孟健AI编程
14天前
发现 Claude Code 的一个杀手级功能:Agent Teams 🔥

之前用 subagent 做并行任务,有个痛点:每个 agent 只能向主 agent 汇报,彼此不能直接沟通。如果 Agent 1 发现了 Agent 2 需要的信息,还得绕回主 agent 中转。

Agent Teams 解决了这个瓶颈——所有 teammate 可以直接互相通信,共享任务列表,甚至互相 challenge 彼此的方案。

实测场景:
代码重构:API层、数据库、测试各一个 teammate,互不冲突还能同步
Debug:多个 agent 并行测试不同假设,互相推翻直到找到真正原因
Code Review:安全、性能、测试三个专家同时审,互相参考发现

开启方式:
settings.json 里加一行:
"CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"

本质上是把 hub-and-spoke 架构换成了 mesh 架构。代价是 token 消耗 3-4 倍,但复杂任务的时间节省远超成本。

这才是真正的 AI 团队协作,不是「一个人带 N 个工具人」。
00
孟健AI编程
15天前
发现一个神器:Superset IDE

一台电脑同时跑10+个AI编程Agent(Claude Code、Codex、Gemini、Cursor),用Git worktree隔离,互不冲突。

3天前刚开源就4k星了🔥

以前等Claude Code跑完才能开下一个任务,现在可以并行处理多个feature/bug,效率翻倍。

适合:
需要同时处理多个任务的独立开发者
想对比不同AI Agent输出的团队
Vibe Coder们的效率神器

开源地址:github.com/superset-sh/superset
00
孟健AI编程
16天前
Anthropic官方免费开放13门Claude课程了🎉

刚看到这个消息太兴奋了,赶紧分享给大家:

Anthropic在Skilljar上线了官方学习平台,完全免费!课程覆盖:

📚 基础入门
Claude 101 - 从零开始学会用Claude
AI Fluency - AI素养基础课

💻 开发者进阶
Claude Code工作流 - 终端AI编程实战
API使用 - 集成Claude到你的项目
MCP服务器 - 构建Claude扩展能力
Agent技能 - 让Claude自动化执行任务

完成课程还能拿结业证书,简历又能加一行了

作为每天用Claude Code的人,这些官方课程简直是宝藏。官方出品的最佳实践,比自己摸索效率高太多

地址:anthropic.skilljar.com

你们打算先学哪门?
02