即刻App年轻人的同好社区
下载
App内打开
阿晓Ocean
1k关注977被关注3夸夸
对世界保持好奇
置顶
阿晓Ocean
10月前
优秀的写作软件 hack 读者的大脑,伟大的写作软件 hack 作者的大脑。
00
阿晓Ocean
13:18
ilya认为,即使AGI实现了,不同公司的AGI,依然会在垂类进行分化,找到自己的生态位。这和一些观点认为,垂类模型和垂类Agent没有发展空间,形成鲜明对比。
00
阿晓Ocean
11:16
Claude Code 带着它的一群小弟开发,每次能连续开发 2.5h 左右,然后就会遇到 100 美元套餐的限制。CodeDAG v0.0.3 版本,让 Claude Code 接续开发了 6 次,一共 15h 左右。要是买 200 美元的套餐,或许能一口气开发 15 小时,直接搞定。

不过,整个过程的瓶颈不在于 AI 写代码,瓶颈在于我写文档、核查文档。

毕竟,一行错误的文档描述,就会造成 10 行错误的代码实现,影响 100 个用户的使用体验。不得不慎重。
12
阿晓Ocean
1天前
Benchmark往哪走,模型训练团队就往哪走。奖励信号往哪走,模型就往哪走。选票往哪走,政客就往哪走。领导往哪走,官僚就往哪走。
00
阿晓Ocean
2天前
当谈及人类的注意力时,如果将其与AI的注意力机制进行对比,我们通常只关注人类注意力的能力和效果,却忽略了其使用成本。

实际上,一个人在一天之内的注意力总资源似乎是有限的。我们可以在一段时间内集中注意力,但时间过长,注意力就会开始分散,无法集中。

这似乎意味着人类的注意力依赖于某种资源,这种资源会随着使用而逐渐消耗,只有通过休息和睡眠才能逐渐恢复。但是,这种资源与普通的体力或能量还不太一样。有时候,即使人还具有相当多的力气,也不饿,大脑血糖浓度可能也还充足,但依然存在注意力资源被耗尽的情况。

如果不仅仅是能量问题,对应于机器学习来说,不仅仅是算力问题。那么,人类注意力消耗背后所对应的那个资源,对于机器去模拟来说,大概率是某种空间的存储。这似乎意味着在机器的注意力机制中,采用某种以牺牲空间来提升推理效率或推理效果精度的方法,与人类也是类似的。
00
阿晓Ocean
2天前
绝大多数有效的组织首先具有稳定的结构,其次在稳定的基础上,又可以不断地更新、生长与迭代。

阿晓Ocean: 多智能体应该是关于组织的,而非关于角色的。

00
阿晓Ocean
7天前
看完“The Thinking Game”,莫名其妙想到了黑镜里的这一集。哦不,是右边的图
00
阿晓Ocean
8天前
2025年还有一个月就结束了,提前预测一下今年年度四大模型:

1. Google:最强前端、设计与绘图模型,Gemini 3 Pro
2. Anthropic:最强全栈编程模型,Opus 4.5
3. DeepSeek:最强数学模型,DeepSeek-Math-V2
4. OpenAI:最强……成人?……模型?🐶
40
阿晓Ocean
8天前
在编程的工作流逐渐连贯起来之后,即使是100美元的Claude Code套餐,现在也常常遇到使用上限。于是现在每天早上起床后,第一件事就是给Claude Code发一句“早上好”。这样,相比于早饭之后开始工作,能将5小时的计时窗口向前拓展一小时🤣
00
阿晓Ocean
14天前
虽然说Gemini 3和Codex 5.1 max的能力可能超过了Sonnet 4.5。但是Codex的CLI或者插件,或者Gemini CLI或者Gemini 插件,甚至Antigravity的IDE,在使用体验上,离Claude Code还差很远。

不是产品形态的问题,单纯是产品功能的完善和细致的问题。比如是否有灵活的Bash许可控制与切换功能。是否在yolo模式下依然能有沙箱安全的保证?是否有SubAgent去将任务进行分块,从而减少上下文的占用?是否有斜杠命令,让用户快速完成某项操作?记忆文件是否能够通过@去引用其他文件而不必多处复制。是否能通过拖拽来引用文件?是否有hooks功能去做一些自动化操作?

现在非常想知道是否有可能将 Gemini 3或者Codex的模型接入Claude Code中,以及是否近期Opus 4.5就会发布。
11