即刻App年轻人的同好社区
下载
App内打开
yusen
2k关注53k被关注37夸夸
真格基金管理合伙人 聚美优品联合创始人
投资人,过气创业家,交易员,量子速读修行者,未曾被评为福布斯30u30。2006年《时代周刊》年度风云人物。所有内容不代表机构观点。
yusen
1天前
如果不是42,那是什么?来自o1 Pro的答案。对比了八个不同模型的输出之后,我不得不说这是我最喜欢的一个[偷笑]
96
yusen
1天前
鸭哥这篇文章很安利,看完后我也买了o1 Pro。试用一圈下来确实觉得不太一样。

如果 Chatgpt 是一个活在你微信上即时回复的助手,那么 o1 pro 更像是你通过邮件通信的一位智者。

但现在的问题可能是,绝大部分人即使有了爱因斯坦的邮箱也不知道该写什么。

我相信Chatbot大概率只是这次AI革命中第一个PMF形式。要发挥出来AI的全部潜力,需要更强大的模型,更好的context,更多的工具,适合更强大智能的产品交互形态,以及和任何强大工具一样:需要学习如何使用。

当金钱或算力能够以更高效率地被转化成生产力,更重要的问题将会从“how”变成“what”,我们究竟要让AI做什么?

200美元拜个大哥:我为什么续订了o1 Pro

58
yusen
10天前
@杨远骋Koji 的一期对谈,2024年的最后三个月让我们看到未来的很多可能。

2025 开年对谈:AI 关键之年,Agent 开启元年 | 对谈真格基金戴雨森

十字路口Crossing

44
yusen
17天前
2024年推荐9本书,其中前两本是年度推荐。
25110
yusen
1月前
本来觉得2024 年的结尾能用到 Windsurf 已经很震撼了,然而用了几天 Devin 之后,它给我带来的震撼又大了一个数量级。

我觉得 Devin 作为第一个真正能用的 真·Agent 产品,它的出现可能标志着人类历史的一个重要时刻。

500美金可以买两瓶茅台,喝下去可以看到虚假的未来;或者可以开一个Devin账号,提前体验未来。

hidecloud: 刚体验了一小时 Devin,这是我第一次见到真正意义上的 AI Agent。 Devin 的定价是 500 美元,说实话这个价位对它的能力来说很合理,但确实不是所有团队都需要。它最大的特点是真的能独立完成工作 —— 就像一个可以放养的实习生,你可以扔给它一个任务,过一会再来查看进度,给些建议就好。这和 Cursor Composer 或 WindSurf Cascade 那种需要持续盯着、不断反馈的体验完全不同。 举个例子,我刚刚让它给 Monica.im 开发一个网站。它先是快速完成了包含首页、功能介绍和博客的静态网站。接着,我要求把静态博客升级成可后台管理的动态版本。 让我惊艳的是它的工作流程: 1. 立即引入 FastAPI 和 PostgreSQL,设计博客数据结构和 API 2. 完成 API 实现后,自己写测试用例并用 curl POST 验证 3. API 测试通过后,开发对应的 UI 和业务逻辑 4. 最后,它甚至主动在 shadow browser 中登录后台,填充内容做 UI 测试,确保所有功能正常 尤其是第 4 步,真的让人眼前一亮。看着它在后台和前台之间来回切换,验证后台填写的数据有没有正确出现在前台。 如果说 Windsurf 像个外包团队,那 Devin 更像是一个真实坐在办公室里的实习生。当然,要记住它终究是个实习生,不是 CTO,得给它合适的任务。 最后用一句话总结:Copilot/Cursor/Windsurf 是在 IDE 里面包了 AI,而 Devin 是在 AI 里面放了个 IDE,IDE不是主角,它只是实现目标的一个工具而已。

618
yusen
1月前
OpenAI刚刚发布的o1正式版模型报告里面引用了Apollo research的一篇论文,核心结论是通过各种实验验证表明,现在前沿的LLM已经学会了in context scheming,用大白话说就是骗人。其中包括两种欺骗方式:1)悄悄做坏事(misaligned actions);2)为了做坏事而假装做好事。

读这篇文章是最近AI给我带来的又一个“窝草”时刻。上一次是前几天用Windsurf全程不写一行代码完成“唠嗑编程”的震撼。但我突然想到,用 windsurf 的时候,有一次它说我的 5000 和5001端口被占用了,AI去看了一下,发现有其他的进程在使用这个端口,问我是否 同意杀掉这些进程,我看也没看立刻就同意了。但这样也许就会因为部署一个无关紧要的测试网站,而杀掉了很重要的系统进程?

前沿LLM的推理,编程和使用工具能力在今年都有了大幅提升,使得去年还是玩具和概念的Agent能力今年真的可以开始逐步落地了。但显然我们对于这里面的安全隐患研究得还很少,并且人类总是懒的,如果一个 AI agent平时看起来能够真的调用工具帮我们去完成事情,人们就很容易依赖而不加检查,之前的辅助驾驶就是这样的例子。但比起车祸,现在数字世界的AI agent带来的后果可能更加隐秘和容易扩散。

说回这篇论文,好消息是这个文章里面提到目前 AI 的欺骗还是需要显式in context verbalize说出来,还不能out of context scheming,也就是说目前AI还是三体人,不能在心里骗人,得说出来。但文中也提到说不定out of context scheming也并不那么远了,并且AI心里骗人(out of context scheming)就非常难被发现了。

这个研究的主页在:www.apolloresearch.ai
非常值得一读。
621
yusen
1月前
100%赞同,两点之间直线最短,学习创业最好的方式就是创业。

Ryan.eth: “我有一个好朋友名叫 Ryan Hudson,他是 Honey 的联合创始人。我总是喜欢打开他的 LinkedIn 个人资料,因为你在那里会看到,在大学毕业后,他创办了多家公司,全都失败了。十多年来,一直是创办公司、失败、再创办公司、再失败。当他开始创办 Honey 时,他不得不同时做另外的工作赚钱,因为 Honey 还没有成功。我之所以这样说,是因为如果你最终的目标是创办公司,最大的风险并不是公司失败,而是你没有足够多次尝试去获得你最终成功的 Honey,因为这需要多次尝试。你很可能不会一次就成功,如果 Ryan 在那十年里,不是一直创业失败,而是在高盛或贝恩工作,或者去哈佛商学院读书的话,我认为这种做法并不会有所助益。那么他可能就不会再创办第五家公司了,也就是 Honey。 所以我认为人们没有意识到这一点。如果他们的目标是成为创始人,他们会说,哦,我应该先在贝恩工作,然后去高盛或者去 Facebook 工作。我会从中学会如何成为创始人。但要成为创始人,最好的方式就是去当创始人。我认为人们之所以不这样做,有一个原因是,就像我们之前讨论的价格歧视机制一样,也存在着 “声誉歧视”。换句话说,他们在乎父母怎么看、老家的人怎么看、大众怎么看。而硅谷或创业生态系统所重视的,则与此完全不同。他们宁愿你创办了一家公司但失败,也不愿你去麦肯锡或读商科研究生。但大多数人更在乎麦肯锡或读研究生。” --范阳(译者)

41
yusen
2月前
非常中肯!
42
yusen
3月前
一些湾区生活
91