即刻App年轻人的同好社区
下载
App内打开
阿头ATou
453关注775被关注4夸夸
@Nieta
ACG fan
stay involved
think different, and act accordingly
置顶
阿头ATou
2年前
你好,我是阿头,在捏Ta WaytoAGI

about me
-ex 游戏行业,爱折腾
-相信:正直,好奇,开放,真诚

做一些有趣的,酷的事。let’s create

微信:Acclerator1989
106
阿头ATou
4天前
阿头ATou
6天前
某厂的 token plan 传递的信号叫做:credit 不值钱👎
00
阿头ATou
7天前
首先爱用户,再谈做产品
00
阿头ATou
7天前
下面那篇发布时间更晚😅
00
阿头ATou
8天前
飞书的是默认不公开的,
Slack 是默认公开的,
AI native 首先得 context 友好。
00
阿头ATou
11天前
可以被 verify/eval 的任务对 agent 来说是“容易”的,不论在人类视角看起来有多难,避免人类成为瓶颈是放大 agent 价值的极佳手段

高速的 loop>聪明的 loop,此事在 nano banana 训练中亦有记载 //@颗颗饱满: 老师你好 真诚发问 为什么说“是否理解autoresearch”是个区分线?这背后的逻辑是啥? 是因为对于agentic loop理解在人群中有明显分界线吗?

阿头ATou: 来自 Andrej Karpathy, 不同人看待 AI 的撕裂感: 从我的社交媒体时间线来看,人们在对 AI 能力的认知上正出现越来越大的鸿沟。 我认为第一个问题在于使用的时效性和服务层级。很多人大概是在去年尝试了 ChatGPT 的免费版,并让那种体验过多地主导了他们对 AI 的看法。这类群体的反应往往是嘲笑模型的各种古怪表现、幻觉等等。是的,我也看到了那些疯传的视频:OpenAI 的高级语音模式(Advanced Voice Mode)在面对“我应该开车还是步行去洗车店”这种极其简单的问题时语无伦次。但问题在于,这些免费的、陈旧的或已淘汰的模型,并不能代表今年最新一轮最先进的智能体(agentic)模型的能力,尤其是 OpenAI Codex 和 Claude Code。 但这就引出了我的第二个问题。即使人们每个月支付 200 美元来使用最先进的模型,它的许多能力在高度专业的技术领域也是相对“极化(peaky)”的(即在某些特定领域异常突出,而在其他领域平平)。围绕搜索、写作、建议等方面的日常查询,并不是能力取得最显著、最戏剧性进步的领域。部分原因是由于强化学习(reinforcement learning)的技术细节及其对可验证奖励(verifiable rewards)的依赖。但另一部分原因是,这些日常用例在科技公司寻求技术突破(hillclimbing)时并没有得到足够的优先权,因为它们不能带来同样巨大的商业价值($$$)。金矿在别处,研发的重心自然也就随之转移了。 于是,这就引出了第二类人群:他们不仅 1) 付费并使用最先进的前沿智能体模型(OpenAI Codex / Claude Code),而且 2) 在编程、数学和科研等技术领域将它们用于专业工作。这群人最容易患上“AI 狂热症(AI Psychosis)”,因为截至今年,AI 在这些领域的最新进展简直令人瞠目结舌。当你把计算机终端交给其中一个模型时,你现在可以看到它们轻松“秒杀(melt)”那些你通常认为需要几天甚至几周才能完成的编程难题。正是这第二类人,对 AI 的能力、其进化的斜率(发展速度)以及各种与网络安全相关的连锁反应,赋予了高得多的重视程度。 长话短说(TL;DR): 这两个群体的人完全是在“跨服聊天”(各说各话)。现实情况确实是这两者同时存在:OpenAI 免费的、且我认为有些被边缘化(?)的“高级语音模式”会在你的 Instagram 短视频里搞砸最愚蠢的问题;与此同时,OpenAI 最高层级的付费版 Codex 模型却能花上 1 个小时连贯地重构整个代码库,或者发现并利用计算机系统中的漏洞。AI 的这一部分能力之所以真正奏效并取得了戏剧性的进步,是因为它具备两个属性: 1. 技术层面: 这些领域提供了可验证的明确奖励函数,这意味着它们极易接受强化学习训练(例如:单元测试是否通过一目了然;相比之下,写作的好坏就很难进行明确评判)。 2. 商业层面: 它们在 B2B(企业对企业)场景中具有高得多的商业价值,这意味着研发团队绝大多数的人力都集中在提升这些能力上。 于是,就造成了我们现在看到的局面。 ---- 我的补充:是否理解 Autoresearch 是一个很有意义的区分线。

00
阿头ATou
12天前
余华,智能体,影视飓风

奇妙的混搭(正片里还有🏀)
01
阿头ATou
13天前
上海好友即将-1🥲
00
阿头ATou
13天前
Antigravity 荣获 good artist 奖,由 tibo 认证
00