即刻App年轻人的同好社区
下载
App内打开
朴哲一
869关注424被关注0夸夸
🦅 现一人公司 🛠 前 8年ToB SaaS创业
📖 书虫 🚴 骑行 🐈 猫奴
🎫 先锋话剧观察员
🧘🏻 践行斯多葛
🎮 ENFJ-A
朴哲一
7天前
没有 AI,按照我以前的编程习惯,我一个人,是做不到这样的测试覆盖的🤣
11
朴哲一
9天前
🥳有启发就好哈哈哈 //@liunice: 看了,有启发!

朴哲一: 谁是我的新王! 11月18日,Google发了Gemini 3 Pro。 11月19日,OpenAI发了GPT-5.1-Codex-Max。 11月24日,Anthropic发了Claude Opus 4.5。 三家公司像约好了一样。 排着队往我脸上扇巴掌。 每一巴掌都在说:你以为你懂AI了? 天真。 有粉丝问我怎么看。 我怎么看? 我用眼睛看。 如果你赶时间,记住一句话就行: Claude Opus 4.5是目前最强的。 但也是最贵的。 就像兰博基尼是最快的。 但你买得起吗? 综合编程能力排个序: Claude Opus 4.5 > GPT-5.1-Codex-Max > Gemini 3 Pro >> Claude Sonnet 4.5 但这个排序有个问题。 它假设你只在乎"综合能力"。 问题是,谁在乎综合能力?反正我在乎性价比。 其实,你需要的是:这个具体的活儿,谁干得最好。 前端/设计类任务:Gemini 3 Pro。这货的审美不知道怎么训练的。 反正比我强。 指令遵循差点意思,但创造力可以。 就像那种不太听话但有才华的实习生。 其他所有编程任务:Claude Opus 4.5。 没什么好说的。 就是强。 SWE-bench跑到80.9%。 人类历史上第一个超过80%的模型。 当然,人类历史也就这几年有这玩意儿。 预算有限但又想要强模型:GPT-5.1-Codex-Max。 便宜量又足。 它有个"compaction"技术,能在超长任务里保持不犯糊涂。 适合那种一干就是几个小时的大活儿。 Claude Sonnet 4.5:没钱但用想要用 ClaudeCode 的。 能力被其他模型全面碾压,但好在遵循指令能力还行,ClaudeCode 生态配合起来也不错(比国产模型都要好)。 就像你买了iPhone 16之后,iPhone 15就只能拿来垫桌角。

00
朴哲一
9天前
谁是我的新王!

11月18日,Google发了Gemini 3 Pro。

11月19日,OpenAI发了GPT-5.1-Codex-Max。

11月24日,Anthropic发了Claude Opus 4.5。

三家公司像约好了一样。

排着队往我脸上扇巴掌。

每一巴掌都在说:你以为你懂AI了?

天真。

有粉丝问我怎么看。

我怎么看?

我用眼睛看。

如果你赶时间,记住一句话就行:

Claude Opus 4.5是目前最强的。

但也是最贵的。

就像兰博基尼是最快的。

但你买得起吗?

综合编程能力排个序:

Claude Opus 4.5 > GPT-5.1-Codex-Max > Gemini 3 Pro >> Claude Sonnet 4.5

但这个排序有个问题。

它假设你只在乎"综合能力"。

问题是,谁在乎综合能力?反正我在乎性价比。

其实,你需要的是:这个具体的活儿,谁干得最好。

前端/设计类任务:Gemini 3 Pro。这货的审美不知道怎么训练的。

反正比我强。

指令遵循差点意思,但创造力可以。

就像那种不太听话但有才华的实习生。

其他所有编程任务:Claude Opus 4.5。

没什么好说的。

就是强。

SWE-bench跑到80.9%。

人类历史上第一个超过80%的模型。

当然,人类历史也就这几年有这玩意儿。

预算有限但又想要强模型:GPT-5.1-Codex-Max。

便宜量又足。

它有个"compaction"技术,能在超长任务里保持不犯糊涂。

适合那种一干就是几个小时的大活儿。

Claude Sonnet 4.5:没钱但用想要用 ClaudeCode 的。

能力被其他模型全面碾压,但好在遵循指令能力还行,ClaudeCode 生态配合起来也不错(比国产模型都要好)。

就像你买了iPhone 16之后,iPhone 15就只能拿来垫桌角。

AI不是蠢,是你不会喂

21
朴哲一
20天前
现在代码开发就靠这个 Skills ,让 Claude Code 调用 Codex gpt-5.1-codex 开发,最后让 Claude Code 做一次 CodeReview ,效果拔群!
01
朴哲一
21天前
用我的 cc-devflow 构建的 it 团队,拆分需求、逐步迭代,已经渐入佳境。虽然速度慢,但胜在质量好哈哈哈。
00
朴哲一
25天前
在算力不足百倍的桎梏下,三家中国AI以工程极致优化、成本颠覆与商业验证,逼近甚至超越巨头模型。

道在于不争规模,专注效率,于有限中生无限。

https://mp.weixin.qq.com/s/hCAVc4mq0hyt_DTmkx29iw

00
朴哲一
27天前
上下文不是越大越好,信息如水,满则溢;

瓶颈面前,唯有让Agent在环境中留痕,用代码织出世界,让记忆脱离窗口,才能从有限跳入无限。

工具是借物,环境是自造,飞跃源于认知切换——不装满背包,而是建起房子。

https://mp.weixin.qq.com/s/ZxtbL6zHsywmtJUG_PdPGg

00