即刻App年轻人的同好社区
下载
App内打开
芦思苇
88关注57被关注0夸夸
🤖Context Is All You Need
👷‍♂️在看 AI Native PM 工作机会
📸业余摄影师
💻在Coding 一个摄影类工具
芦思苇
17天前
Claude 控制的一个月,终于结束了。

在开始这一切之前,我以为是人类会把AI榨干,开始之后发现搞错了,Pro 会员的额度太少了,很容易触发5小时上限,也正是这样潜意识里觉得每一周的用量都不能浪费,然后为了把每个周的 token 用完,为了不让AI闲着,每一次睡前都想给他布置个任务,结果就是每天都比原计划晚睡至少一个小时🥲这个月的生物钟是被 Claude 打乱的

Claude 的会员是按31天计算的,实际会有五个周的额度,最后一周只有三天,前两天几乎连续不断的用满了八个5小时额度,最终把最后一周额度用光了,是人类被AI榨干了🤪

再过10分钟就可以开始下个周期使用Max会员了,人还会继续被AI遥控吗?🤔
00
芦思苇
20天前
@刘小排 使用AI的思路就很受启发,就是把用 AI 当成雇员工,AI探索者里的普通人可能一个月花一两百美元雇员工,还经常受到额度限制,相当于只雇了一个员工,每周只工作一定的时间就休息了(token 用完),他一个月投入上万美元来雇AI 员工,相当于雇了几十上百个员工且无休息的工作,这个效率和产出量级必然是不一样的。
所以对个人来说,接下来比拼的或许是谁对自己管理AI员工的能力有信心,能投入更多的预算?

歸藏: 目前最影响 AI 产出效果的是你的思想: 你究竟是把它当成一个人去发工资,还是把它当成一个订阅产品去交订阅费? 换句话说,你敢不敢为了一个项目给它足够的权限,让它燃烧足够的 Token? 我现在发现,确实是思路或者思维限制了我。 我一直以为自己是敢给 AI 花钱的,但在目前这个阶段,确实算不敢的

02
芦思苇
20天前
所以下一次的腾飞要等 verifier 发生质变了

CageZ: Anthropic 在 Agent Teams 发布的时候也公布了一个不错的内部实现,花2万美金/2周,用 multiagent 从头写了一个 C 编译器,推荐阅读。我读完主要的感受是 : 1/ Coding AGI 真的到了,今天 Codex 博客中也说了自己在 fix model 中起了贡献。 2/ multi-agent 的价值体现在任务的时间尺度可以再次指数级增长,因为 线性的 O(N) 任务被折叠成 O(log N) 的分层协作。于是更多原本不可能的任务可以实现,大家体感的 token 消耗量会再上一个台阶。这个思路其实中国团队贡献了很多,Manus Wide Research,Kimi Agent Swarm 在这里都有重要贡献。 https://www.anthropic.com/engineering/building-c-compiler 文章主要内容 1) 他们用 16 个 Claude 并行写了一个 C 编译器 这个目标满都很大,之前 coding agent 不太能做好。从零写一个 Rust C compiler,能编译 Linux kernel。作者说他们让 16 个 agent 并行跑、几乎不介入;两周内大约 2000 次 Claude Code session、花费约 2 万美金,产出 ~10 万行代码的编译器,能 build Linux 6.9(x86/ARM/RISC-V),还能编译一堆大项目(QEMU/FFmpeg/SQLite/postgres/redis 等),并且在多数 compiler test suite 上做到 ~99% 通过率。 2) “能跑很久”不是模型自然具备的,而是 harness 设计出来的 Claude Code 默认需要人持续在线互动,否则会“停下来等你”。作者做了个非常简单粗暴的 infinite loop harness:让 Claude 做完一件事立刻接下一件事,永远不停止;并强调要在容器里跑,而不是在真机上。这个思路和 Openclaw 的比较深似。 3) multi agent 的关键收益:high throughput 吞吐 + 不同价值任务的分工 并行能解决两类问题: 一个 agent 一次只能干一件事,并行能把 debug/修复多个 failing tests 的速度显著拉起来; 角色分工:有人写功能、有人做文档、有人做性能、有人做代码质量整治等。 他们用 git + “任务锁文件”做了一个很原始但有效的同步:每个 agent 认领一个任务文件,避免重复劳动;合并冲突很多,但 Claude 往往能自己解决。 4) human in the loop 部分:verifier 质量决定上限 作者反复强调:agent 会非常努力地“通过你给它的验收器”,所以验收器如果不严谨,最后就是“把错误问题做得很完美”。 于是他自己大量精力花在:找高质量 test suite、写 verifiers/build scripts、补 CI、把“新功能经常破坏旧功能”的回归问题压住。 同时要“站在 Claude 的视角”设计反馈:控制输出避免污染上下文、把关键信息写日志便于 grep;还要考虑模型对时间没有感知,傻跑很久测试。

01
芦思苇
20天前
Claude 的50 美元羊毛大家别忘了薅一下。

感谢奥特曼的价格战,Claude 大发善心!

条件:你是 Pro 级以上会员用户。打开 Extra uasage 开关。

路径:打开网页版 Claude.ai,进入 Setting -> Usage,在最上面会有一个小的活动横幅,有个按钮点击它(刚刚太激动忘了截图),刷新一下就能在下面的 Extra usage看到赠送的 50 美元额度了。用一个问题问了下,只要你周额度没了就直接能用它了。

Opus 的贵变得更具像化了,新开窗口只问了一个小问题,0.6美元就没了🥹
00
芦思苇
21天前
睡前打开 Claude 想问个问题,意外的发现 Opus 4.6 偷偷发布了,Crazy,100 万的上下文,Opus 将再次遥遥领先🤪

上下文的大幅度有效提高,会带来使用场景的质变,更多的工作将被颠覆,让我们看看又有哪些公司的股价下跌📉

从来没有一次这么期待2月9号的到来(到这一天才能升级到100 刀套餐😫该死的反华公司——却创造出了最好用的产品),最惨的事情大概就是 Opus 4.6发布了,而我本周的额度仅剩 1%🫠

山姆奥特曼刚刚宣布要大打折扣,还没等落地,反华公司就迎头一击,奥特曼请继续出牌🤪
01
芦思苇
23天前
我觉得一个简单的逻辑就是,如果一家公司声称 AI Native,但却没有给合适岗位的员工提供最顶级的模型和足够多的 token,那就代表:
1. 要么老板不懂AI
2. 要么老板不相信 AI能创造出足够大的价值
3. 要么老板不相信他的员工

而如果你是一个坚信用好AI,就有机会创造出数千数万倍订阅费的人,那也没必要去这里了。这句话也很重要,这是个双向选择的过程。

简单粗暴方法判断一个公司是否 AI Native - 小红书

01
芦思苇
23天前
LLM 最大的问题是每次推理都有成本,最终会受到物理世界的电力和显卡的限制,你不可能让世界所有人都用上最强大的opus 模型,但可以让所有人都用上 tiktok

王慧文: LLM不太可能复现互联网泡沫的股价走势轨迹, 具身智能有可能复现。

00
芦思苇
25天前
今天元宝做活动发红包,我顺手把链接转到亲戚群。半小时过去,好几个长辈群里说:“不会弄”。

那一刻突然挺感慨的。我每个月花着上百美金订阅各种国外最顶级的模型,而离我不远的这群人,甚至连国内免费的 AI 都还没开始用。

对于我们这种在写字楼里的人,AI 是「杠杆」,我们用它卷效率、写代码、出方案,是锦上添花。

AI 对普通人到底意味着什么?对那些甚至没有一份五险一金工作的人意味着什么呢?

它让学历不高的父母,有机会亲自辅导孩子的学习;
让看不懂说明书的独居老人,拍张照就能知道这两种药能不能一起吃;
让进城的务工者,看穿合同里那些绕来绕去的文字游戏。

AI 有机会抹平那道原本只有受过高等教育、或者花钱求人才能跨越的门槛。

AI 对于普通人到底意味着什么?或许就是让普通人,变得没那么普通了。
12
芦思苇
26天前
干活的话,还是直接用最顶级的工具,100 刀或者 200 刀的 claude code,省心省力,再配个 20 刀的 Cursor ,顶级模型全搞定了。用了不同的工具,最后会发现,省人的工具才是最有性价比的。

哥飞: 问个问题,现在国产模型的编码能力也慢慢上来了,有人做了国产的 Claude Code 类产品吗?

00
芦思苇
29天前
最近观察身边各种人对AI的反应,感受是,AI像一条大河把这个世界分成了两类人,只是其中一类人还没有意识到这件事。
00