即刻App年轻人的同好社区
下载
App内打开
张无常Hayes_Zhang
679关注4k被关注5夸夸
公众号:张无常
AI Builder,ex AnyGen/飞书/今日头条
wx:hayeszhang007
置顶
张无常Hayes_Zhang
7月前
有时候你会被时髦、花里胡哨的东西吸引,忽略真正的热爱。

等你反应过来,十年过去了。

你会拍大腿:我TM 都干嘛去了?

有的东西能等,比如小众文艺电影、比如配角(最新的比如《一战再战》里的 SENSEI)。

有的东西等不了,比如壮士暮年的 NBA 巨星(保罗要退役了)、万金油 3D。

更多的东西在中间:读什么书?刷什么视频?因为什么而工作?等等等等

品味,TASTE,不只是具体风格认知,更是元认知,关于你是谁,你要去哪里。
818
张无常Hayes_Zhang
15:02
怎么说呢,看完 WWDC 2026 最大的感受是:苹果讲了一个小时的 Siri Apple Intelligence 功能,花里胡哨、无孔不入,即使很多都是尚未交付的录播 demo ——但在 Coding Agent 突飞猛进、人均手搓 Agent 的当下,还是让人觉得都是上个时代就应该做好的东西、毫无创意、提不起一点兴趣。

(除了基于空间图片的 Reframe 调整构图功能让我有点期待之外)

有意思的是:如果我没记错的话,用户体验部分,苹果完全避开了 Agent 这个词,只是在开发者部分提了一次 Agentic Coding。

AI 时代的苹果,最大的卖点竟然是隐私(靠端侧模型和私有云),当然是一招安全牌了,只是也太没想象力了……
01
张无常Hayes_Zhang
3天前
方向设定是人类扮演的唯一有意义的角色。

Direction-setting was the only meaningful role a human played.(Anthropic)
10
张无常Hayes_Zhang
3天前
《火线》后劲有多大呢?这两天突然想看,翻出资源发现,原来之前看完 S3E11 就停下来了。奇了怪了,怎么能弃坑「个人最佳美剧」呢?——直到重新打开 S3E11 的结尾,想起来了,那种巨大的、浓稠的、难以言状的冲击……不但在当时让人无话可说,甚至让我一度不敢(想)再度打开,直到一年多后的今天。

完完全全就是 David Simon 的形容:《火线》不是电视剧,是一部视觉化的小说。

伟大的小说。
11
张无常Hayes_Zhang
5天前
Dynamic Workflow 真是烧 token 狂魔,什么概念呢?一天烧爆我 2 5h 额度限制了,5 分钟 130 token、17 分钟 500 token……怎么说呢,乖乖把之前因为用不满降级的 5x Max 订阅升级会 20x 吧……谁让你效果确实好呢,钱花得心甘情愿……

张无常Hayes_Zhang: Claude Code Opus 4.8 Dynamic Workflow 上手感受: 1、结果质量确实高!简直惊艳! 大力出奇迹是真的:任务拆得够细、每个子任务单独安排 SubAgent 、给足 1M Context Window 猛猛干,效果就是好! 最突出的特点是,干活真细:能在超长文档中找到前后联系,也能真正深入到每一处文档/代码的细节、找出明确的问题清单(往往还很长) 在模型上下文长度没变的情况下,Dynamic Workflow 确实更好的 multi-subagent 机制提升了长上下文处理效果。 另外,读 Dynamic Workflow 出的报告,确实能明显感觉到 Opus 4.8 敢于反驳、提尖锐意见,同时写作风格大幅好转,虽然还是有个别奇怪的话,但整体中文自然多了 2、消耗 Token 量大吗? 我开了俩Workflow 任务,相比官方演示 case 都属于简单项目:一个简单项目的整体代码 review,一个非代码类的大批量文档项目分析。 前者只启动了 17 个 Agent(上限是 100 个),耗时 23m5s,消耗 token 2.7M;后者 13 个 Agent,21 分钟消耗 token 1.3M。 什么概念呢?我 Max 5x 订阅的 5h 用量从 2% 用到了 75%,简单推算下,如果是 50+ Agent 的超大型任务,别说 5x 订阅了,20x 订阅估计都很难一次跑完。 难怪做了断点续跑……

01
张无常Hayes_Zhang
6天前
怎么 Claude Design 有点管杀不管埋的感觉,咋跟 Codex 精雕细琢反着来了……
12
张无常Hayes_Zhang
7天前
Codex 降门槛泛化 + ChatGPT&Codex 融合超级 app

vs

Claude Code 做深做长 + Cowork/Design app矩阵

谁能笑到最后?

我目前的主力还是 Claude Code,但双持了几天,已经能明显感觉到 GUI 的优势和 Codex 设计的巧妙了,关键的是,似乎没什么任务是迁移过来做不到的。越想越觉得 Dan Shipper 说得有道理:我们快速经历了 CLI 复兴,现在是时候让 GUI 回归了。

btw 之前老觉得 OpenAI 主要靠模型、产品设计能力远不如 Anthropic,最近在 Codex 上越来越感觉,可能只是没发力?
44
张无常Hayes_Zhang
8天前
Claude Opus 4.8 越用越喜欢的3个点:

1、claude.ai :4.8 很喜欢画图来说明问题,这应该是之前几代没有过的表现,每次出的 SVG 图都挺好理解的,虽然有点慢……(图 1、2,4.8 Max)

2、claude.ai :面对复杂问题 4.8 更愿意 Agentic 地边搜(调工具)边想,结果质量也有明显提升,这个特点在 4.6 升级到 4.7 时开始出现,4.8 这一代更加明显了(图 3,4.8 Max)

3、Claude Code 里的 4.8 明显比 4.7 更喜欢把复杂任务拆分后分派给 subagent,在各个 subagent 更长的上下文里充分干活,而不是「不会带团队,一个人干到死」

——注意这里说的是 4.8 agentic 自主决定分派任务,不用手动安排 Dynamic Workflow(当然更复杂的任务还是需要的),所以实际体验就是:无感、爽!

这应该是明显的训练偏好,效果确实好(图3,4.8 xhight)
52