即刻App年轻人的同好社区
下载
App内打开
CageZ
109关注2k被关注2夸夸
拾象科技AI research lead 我们的公众号:海外独角兽
复旦CMU 字节
INTP 网球/科幻
wx: penguinscage
CageZ
13天前
Anthropic 在 Agent Teams 发布的时候也公布了一个不错的内部实现,花2万美金/2周,用 multiagent 从头写了一个 C 编译器,推荐阅读。我读完主要的感受是 :
1/ Coding AGI 真的到了,今天 Codex 博客中也说了自己在 fix model 中起了贡献。
2/ multi-agent 的价值体现在任务的时间尺度可以再次指数级增长,因为 线性的 O(N) 任务被折叠成 O(log N) 的分层协作。于是更多原本不可能的任务可以实现,大家体感的 token 消耗量会再上一个台阶。这个思路其实中国团队贡献了很多,Manus Wide Research,Kimi Agent Swarm 在这里都有重要贡献。

www.anthropic.com

文章主要内容

1) 他们用 16 个 Claude 并行写了一个 C 编译器
这个目标满都很大,之前 coding agent 不太能做好。从零写一个 Rust C compiler,能编译 Linux kernel。作者说他们让 16 个 agent 并行跑、几乎不介入;两周内大约 2000 次 Claude Code session、花费约 2 万美金,产出 ~10 万行代码的编译器,能 build Linux 6.9(x86/ARM/RISC-V),还能编译一堆大项目(QEMU/FFmpeg/SQLite/postgres/redis 等),并且在多数 compiler test suite 上做到 ~99% 通过率。

2) “能跑很久”不是模型自然具备的,而是 harness 设计出来的
Claude Code 默认需要人持续在线互动,否则会“停下来等你”。作者做了个非常简单粗暴的 infinite loop harness:让 Claude 做完一件事立刻接下一件事,永远不停止;并强调要在容器里跑,而不是在真机上。这个思路和 Openclaw 的比较深似。

3) multi agent 的关键收益:high throughput 吞吐 + 不同价值任务的分工
并行能解决两类问题:
一个 agent 一次只能干一件事,并行能把 debug/修复多个 failing tests 的速度显著拉起来;
角色分工:有人写功能、有人做文档、有人做性能、有人做代码质量整治等。
他们用 git + “任务锁文件”做了一个很原始但有效的同步:每个 agent 认领一个任务文件,避免重复劳动;合并冲突很多,但 Claude 往往能自己解决。

4) human in the loop 部分:verifier 质量决定上限
作者反复强调:agent 会非常努力地“通过你给它的验收器”,所以验收器如果不严谨,最后就是“把错误问题做得很完美”。
于是他自己大量精力花在:找高质量 test suite、写 verifiers/build scripts、补 CI、把“新功能经常破坏旧功能”的回归问题压住。
同时要“站在 Claude 的视角”设计反馈:控制输出避免污染上下文、把关键信息写日志便于 grep;还要考虑模型对时间没有感知,傻跑很久测试。
624
CageZ
3月前
我们定义自己为 Investment Research Lab:既是基金,也是 research lab,我们相信理解技术本质的人,可以更快发现 AI 变化最陡峭的地方。

欢迎希望以research mindset做投资的朋友加入共创伟大!

我们身处波涛汹涌的中心|加入拾象

10
CageZ
8月前
我:手搓的代码比AI写得好
我妈:手搓的衣服比机器洗得干净
42
CageZ
8月前
上世纪 50 年代信息论和 DNA 双螺旋的发现,点亮了生命科学与数字互联网这两个最关键的科技树;今天 AI for Science 开始将这两股洪流汇聚并指数级加速。 大模型对生物系统这样复杂、非线性的系统有着前所未有的理解和生成能力,有望成为加速科学发现的关键引擎。

如果说上一代 AI 只是帮助科学家“更快地做旧事”,新一代 Foundation Model 则开始“做以前做不到的新事”。从 AlphaFold 3 、ESM3 Evo 2 等模型,他们把分子-细胞-系统的设计空间瞬间打开,自动化 AI Scientist 则把实验室变成可编排的软件流水线。这意味着十年、二十亿美元成本的药物研发流程,正被重新压缩与重构。

最新的这篇文章我用「Tech/Bio × Generalist/Specialist」四象限为框架,梳理了下面几类玩家:

Biology Foundation Model:深挖单点大模型极限,AlphaFold 3 级别的里程碑是个开始;

AI Scientist:将多智能体编排成实验操作系统,让科研流程变成可复制的 AI Agent;

AI-Native Therapeutics:基于全栈 AI 平台押注复杂疗法,争夺下一个百亿美元药物;

AI-empowered solution:通过独特数据与算法解决行业痛点,带来立竿见影的效率红利。

AI4Science 图谱,如何颠覆10年 x 20亿美金成本的药物研发模式

00
CageZ
9月前
今晚在@极客公园 视频号聊聊对AI Agent 的观察 欢迎即友们有空来捧场
00
CageZ
11月前
今年期待的AI Agent基建三要素:MCP + RL环境 + memory

MCP:Agentic AI 中间层最优解,AI 应用的标准化革命

55
CageZ
1年前
AI创作的软件会是下一代产品/内容的骨架

AI Coding 最全图谱:Agent 将如何颠覆软件

00
CageZ
1年前
我们和RTE开发者社区一起联合出品了Voice AI技术专场 聊聊Her中的语音智能如何实现 感兴趣的朋友来线下一起交流!10月26日在北京

寻找 GPT-4o 时代的 “Her ”|海外独角兽 X RTE 社区

10