即刻App
年轻人的同好社区
下载
App内打开
Random_thoughts
25
关注
1k
被关注
3
夸夸
工程师 跑者
我超越了昨天的自己,哪怕只是那么一丁点儿,才更为重要。
在长跑中,如果说有什么必须战胜的对手,那就是过去的自己。
置顶
Random_thoughts
2年前
写了个 大模型应用开发的教程,公开免费
“因为自己淋过雨,所以想给别人撑把伞”,只为了像我一样的工程师/产品入门大模型开发 少走点弯路。
面向小白,尽量通俗易懂且实用。
大模型应用开发教程
206
15
77
Random_thoughts
7天前
在考虑搞一个 Agent IDE 了, conductor 好用,但是创建 worktree 的速度也太慢了,每次等半天才能分配任务。codex 客户端很不错,但是不支持多人协作。 symphony 支持多人协作,界面又太拉了,对接的 Linear 也不算是 Agent 友好的界面。目前没找到一个比较好的解
0
0
1
Random_thoughts
14天前
OpenAI 的 harness 那篇文章预定今年的年度文章了。 (Karpathy 的 autoresearch 也启发了我)
刚参考这个思路试了下:让 AI 去做一个 普通音频转微信语音 的功能,我只负责给详细的验收条件和想到可能要用到的所有 context。
然后我就眼睁睁看着它自己跑了一个小时:自己跑通流程,打开测试后台去跑测试;中间遇到前置条件不满足、跑不通的地方,AI 还会主动发消息提醒我排查问题,直到最后成功把语音发了出来。不仅如此,它甚至能自动监听线上服务的部署,部署完直接帮我做线上自动化测试……
看到最后语音成功发送的那一刻,真的是汗毛立起来了。
相信今年的一个必然趋势:可验证的结果驱动 AI + 给 AI 充分的基建与上下文权限(比如公开日志、Metrics、文档、测试甚至生产环境权限)。
这种“以终为始”的结果+约束驱动模式,非常像一种 Agent 维度的、加强版的“反向传播”(或者类似 DSPy 的 GEPA)。只不过中间执行迭代和纠错的,变成了更智能的 Agent, 2026可能真的是 AI review 取代 人工 review 的一年了。
20
3
8
Random_thoughts
17天前
我不喜欢 Openclaw, 说一下我的理由,以及开源我的实现思路。
为什么我不推荐你用 OpenClaw?以及 如何构建自己的个人 Agent
86
19
20
Random_thoughts
1月前
5.3 codex真的在编程上把 Claude 4.6按在地上打了
7
3
0
Random_thoughts
3月前
Most people try to turn AI into a rule executor.
A few treat it like a reasoning system:
give intent, give context, then step back.
Ironically, less control → better results.
Scalability starts where micromanagement ends.
7
0
0
Random_thoughts
3月前
建议所有做文科类推理的任务,试试 gemini flash 或 pro
1
0
0
Random_thoughts
4月前
招全栈开发了, 招点有趣的人
目前在上海做 AI 销售,有兴趣的可以聊聊
3
4
0
Random_thoughts
4月前
看了 DeepMind 纪录片后印象最深的是 哈萨比斯的带鱼屏,买了一个后,发现是有史以来最爽的投资
11
3
0
Random_thoughts
5月前
好的 context engineer,在于在调用大模型之前,对 context 预先计算过。
这个计算是指,将冗余或者需要二次推理的信息进行计算为更精准的方式。
例如:用户问「多久之后发生?」
别告诉模型“今天是11月5日,活动是11月8日”,
而是告诉它“还有3天发生”。
人类靠压缩记忆提高效率,AI 也一样,大部分 Agent 开发没有对 context 或者信息做比较好的整理,AI 也没有想的那么智能,越少 AI 在 context 中的推理次数,调用结果越稳定。
Long context ≠ Long-term reasoning
5
0
0
Random_thoughts
6月前
近期越来越感觉到在这个时代,每个人都应该培养一种与 AI 共生的直觉感。
这种直觉,是在提问时能清晰表达、知道这次提问需要补足的上下文是什么
也是在 AI 回答不理想时,敏锐察觉到——问题出在缺失了哪些信息。
7
0
2