即刻App年轻人的同好社区
下载
App内打开
boris包包
441关注1k被关注0夸夸
程序员&设计师 中医黑 INFP-AH
侯世达门下走狗
🌍www.ding.ee
👰@peipei佩佩
置顶
boris包包
2年前
自诩是侯世达、阿德勒和王小波的门下走狗,休谟式的不可知论者。

这几年做的事情有点杂:画过交互稿,做过用研和动效,写过前端和 iOS,也手搓过微服务框架和数据系统;做过白帽,挖过漏洞;AI 领域写过 Agent 编排框架,也从 0 训过基座 LLM 和文生图模型,顺手做过一些多模态和 SFT 相关的开源工作。创业、产品、系统、AI、量化,前后都沾过一些。

在华兴内部创业做过互联网化的FA平台——逐鹿X,也帮红杉中国从 0 1 搭过数据科学团队、独创一级市场量化。后来出来做 SaaS,想做一种介于软件和文档之间的东西,带一点低代码,想把两者那条本来就很可疑的边界拆掉,后来成了“先烈”。

严格说来,职业身份并不十分稳定,但有一点倒是比较稳定:创造具体的东西,改变世界哪怕只是一点点。我追求广度优于深度并深以为荣。

现在主要关心两件事:金融量化和 Agentic RL。

前者吸引人的地方,不只是赚钱这种世俗的目标。市场这东西有意思,主要是因为它不是一个安静的、讲道理的地方。很多金融叙事喜欢假定人是理性的,市场是均衡的,信息会优雅地流入价格,像水流进池塘一样平静。我对这种想象一向没有太大兴趣。相较之下,我更愿意从复杂经济学和行为经济学的角度看市场:它更像一个拥挤、嘈杂、充满反馈回路的复杂系统,人们带着偏见、情绪、局部信息和各自的处境冲进来,互相影响,顺便把价格也改写了。这样看量化,事情就有意思得多。它不只是预测一串数字,而是在猜测叙事怎样扩散,信念怎样形成,偏差怎样堆积,最后又怎样表现为价格。

后者则是另一个让我着迷的问题:智能体到底怎样才算真的能工作。对那种停留在 RAG function calling 层面的玩具式 agent,我兴趣一直不算大。真正让我在意的,是长期记忆、世界模型、自我校准、任务分解、持续学习这些更麻烦、也更本质的东西。Agentic RL 在我这里,不太像一个时髦标签,倒更像一种朴素的执念:想看看智能系统到底能不能从“会说”往前走一点,走到“会做”,再走到“做完以后还会变得更像那么回事”。
22
boris包包
18天前
“可你为什么说我不了解爱呢?”太阳问道。

“因为爱不像沙漠一样静止不动,不像风一样跑遍世界,也不像你一样总是从远处观望一切。爱是转化和完善世界之魂的一种力量。当我第一次深入世界之魂的时候,我认为它是完美无缺的。但是后来我发现,它是一切创造物的反映,也有自己的冲突和激情。是我们滋养着世界之魂,我们居住的地球是好还是坏,全取决于我们变好还是变坏。这正是需要爱发挥力量的地方,因为当我们有爱的时候,总是希望自己变得更好。”

——​《牧羊少年奇幻之旅》

❤️@peipei佩佩
10
boris包包
23天前
会不会在小狗眼里电梯和汽车是同一种东西
00
boris包包
27天前
「真正能干活的AI员工」其实反直觉地看要远比「 AI助理」容易做得多。
LLM 任务的难度,不由「野心」决定,由有没有可验证的目标决定。 而「总结未读消息汇报给我」恰是 LLM 的最坏情形:目标(什么对我重要)是(a) 主观的、(b) 私有的、藏在你脑子里、(c) 因人剧变、(d) 从不明说。

有损压缩的难点从来不是把话说流畅(这 LLM 顶强),是那个取舍函数——留什么、丢什么、把什么放前面——它本质是你的效用函数,而模型拿不到。 它只能塞一个通用效用函数进去:对任何具体的人,这就是「平庸的噪音」;对越高端的人越错,因为高端用户的「什么重要」恰恰最私有、最特异。

#等codex干活过程中的深夜思考
20
boris包包
2月前
人月之后, 2026年软件开发速度应该用:
Verified Agentic Delta per Human Attention Hour per Dollar
单位人类注意力下的可验证变更吞吐量
00
boris包包
2月前
感觉我们家小狗很有诗人气质
00
boris包包
3月前
boris包包
3月前
读了《新政治经济学讲义》对汪丁丁老师路转粉。
00
boris包包
3月前
记忆实质上是一个用经验预测未来、并被现实持续校准的世界模型。而压缩、演化、冲突消解等记忆整合行为——都是生物沿着”最小化自由能”这一个目标函数去迭代而所采用的行为。
00