即刻App年轻人的同好社区
下载
App内打开
shimu
31关注5k被关注3夸夸
眉间放一字宽
shimu
6天前
诗沐问答|我的首次直播:AI投融资、创业、技术、产品,随便问

先和大家说两件真事。第一个,关于投资判断。2024年有个朋友问我:“Anthropic和OpenAI,哪个更值得下注?”我说:“我没法直接给答案。分享一下我的思考方式吧——可以从技术路线和商业化两个维度来看……”,随后我花了一刻钟,给他拆了两个模型的技术底层差异、融资结构。他听完之后有所思考。当年那个选择也让他在这场投资中得到了非常满意的回报。第二个,关于年轻人的选择。前阵子有个刚毕业的年轻人问我:拿到了大厂AI产品offer,怕不懂技术被淘汰,该不该去?我说:“先去,再学。”他担心不懂算法被鄙视。我告诉他:“我当年做网易云音乐时也不懂推荐算法,硬着头皮跟了几个月才慢慢听懂。干就是最好的学习。”他去了,前两天跟我说:现在能看懂简单的模型评估报告了。

我想把这件事做成一个固定栏目:[诗沐问答]
一个关于投资人的判断,一个关于年轻人的选择。看起来离得很远,但背后都是同一个问题:在 AI 这个快速变化的时代,很多判断不能只靠情绪,也不能只靠一句口号,需要有人把问题拆开来看。类似的私信和提问,我隔一阵子就会收到一批:有人问投资,有人问创业,有人问产品,也有人只是想知道自己下一步该怎么选。问题不同,但底层都有共通的困惑。所以我想开一个栏目,在直播里跟大家聊聊天。直播中只干一件事:你问,我答。(而且,完全免费~)

这是我首次自己直播的一个栏目它不是什么系统课程,也不是一场包装得很完整的公开演讲。它更像一个长期开放的答疑现场。我会围绕几个我长期在看、也长期在做的方向来聊:比如“AI 行业和技术变化”、“创业和战略判断”、“产品和商业化”,就像一个持续更新的公开现场:你带着问题来,我尽量把复杂问题讲明白。你可能想问:关于 AI 行业和投资判断:如果现在有一大笔钱,你会选择投大模型底层,还是投上面的应用层? AI 行业现在处在周期中的什么位置——是泡沫顶、死亡谷,还是上升期? 现在做 Agent 创业还有机会吗?投资人到底在看什么?关于创业、产品和商业化:为什么很多 AI 产品第一眼很惊艳,最后却留不住人? 技术进步这么快,产品和商业到底怎么跟上? 一个 AI 产品,怎么从 demo 走向真正有人用、有人付费?关于职业选择和个人成长:我在大厂做产品,怎么不被边缘化? 现在的年轻人,应该去大厂、创业公司,还是自己做项目? 现在进入 AI 行业,到底该押注什么能力? 如果不懂技术,还能不能做好 AI 产品?或者——你只是想过来看看大家都在迷茫什么,也可以。

不是只有宏大问题才值得聊。很多时候,真正能帮人的反而是那些卡在眼前、又确实难判断的小问题。我不保证每个问题都有标准答案。但我会尽量把我怎么判断、为什么这么判断、如果是我会怎么做,讲清楚。

时间:本周六(5月16日)晚 20:00-21:30平台:视频号 【王诗沐Seele】时长:90分钟左右怎么提问?1、在这篇文章下留言2、公众号后台留言3、直播间直接提问

写在最后
我是少数从PC干到移动、再干到AI的人。造过亿级国民级产品,走过弯路,也翻过山。希望我的经验能对你有用。5月16日晚,不见不散。——王诗沐
02
shimu
23天前
D49 | 今天,我们开源了个AutoResearch工具

Thoth是什么?Thoth是一套AutoResearch的harness工具。 人在睡觉时,它自动根据任务去跑;人醒来时,只需要看一眼「前端面板」,进度一目了然。Thoth 解决了 AI 执行的「执行失控症」:任务会断、状态会盲、结果会假、方向会偏。它是一套开源插件,原生支持Claude Code和Codex,让 Agent 持久运行、全程可视、机械验收、长程一致。让 AI 说到做到、干完干对。地址:github.com

D49 | 今天,我们开源了个AutoResearch工具

10
shimu
28天前
忙碌一天回到家已经是凌晨,打开笔记本处理下剩余工作。听到沙发上有声音,回头一看猫在扒拉,转头继续工作。持续听到声音,再回头一看,原来已经拉💩到了沙发上(罩着罩子)……人麻了,只好起身去收拾洗掉两层罩子和沙发表面并除臭……

全部搞完洗澡躺下人难受了,我创业啥苦都没这么难受过。难受到现在脑子里还在想为啥我这么难受?

我必须发出来舒缓下。如有打扰请见谅。
83
shimu
28天前
Quick Q&A about AI Startup 2

我在24年底时写过一篇Quick Q&A about AI Startup,当时收到一些行业朋友来问AI创业、投融资相关的事情,索性就快速输出了一些判断。今天回过头来看,大部分仍可以坚持当时的观点。最近又收到比较多的询问,因此Q&A 2就来了。

Q: 你怎么看最近比较火的A2A概念?

A:和一年前看法一样是个伪概念。它有两层逻辑硬伤:
说未来世界会有非常多的差异化Agent(数量级甚至超过人类),因此A2A的网络很重要。这里面是忽略了基座大模型的进化,过分夸大了skill、harness等。这个问题和当初OpenAI匆忙搞Agent Store是一样的。基座大模型的进化,使得未来单一Agent能处理的任务会越来越复杂,不太会有专门处理某个单一任务的Agent,那么Agents之间的差异就不会大,比人类要小非常多。这样一想,是不是不需要A2A的互联网?或者最多是需要局域网而已。而且大模型的发展趋势就是不断把外部数据、能力内化的过程,出口是单一的,搞那么多交互过程反而是与Transformer黑盒的特点背道而驰;即便未来有A2A的网络,而且它还很重要,那么掌握了基座模型的公司,为啥不会自己做呢?因此,如果想投机搞一把A2A、Skill store之类的概念,我不懂,但至少逻辑是通顺的。如果以此为出发点来创业,可以再深入思考下。

Q: 你怎么看Agent创业?

A:大部分Agent创业是可以归属到投机方式的,那最好要快进快出。因为和基座大模型的引力相比,Agent创业方向的核心优势是速度快,得做到预判下一版甚至两版大模型的迭代方向来做(最近Claude源码泄漏直接把创业难度提高到预测下两版),最近一两个月立项搞harness agent创业的就很难了,产品上线打了三四个月会发现基座大模型迭代了,要么把Agent的能力内化吃掉了,要么原有那套工程优化不适用了,得重头再来。除了速度要快,本质上PK的是营销水平,这个就要思考下了。

Q:你怎么看Loopit连续融资的新闻?

A:我思考的结论:这个所谓“下一代AI抖音”的方向,可以视作上面投机方式的打法(非贬义),也就意味着要提前想清楚,后面谁会来接盘,怎么实现快进快出。背后思考是:这个产品形态商业模式艰难。首先无法向用户卖token;其次里面的很多小互动游戏无法向用户收费;那么最终剩下广告,可以问问从23年开始到现在做AIGC内容产品的公司,能挣多少广告费?这个产品形态很难变成社交媒体,本质上和每隔几年主流社交媒体上就流行一阵的meme玩法一样(一直都有的匿名AMA就是,还有23年火过一阵的各种模拟器)。形成社交媒体需要内容能立人设,形成粉丝关系(人的本性),人设包括外表、言论,才华是现代社会里人设比较不重视的了,何况是造meme小游戏的才华。外表和言论分别被短视频、推特的巨头把持。我不认为这个东西变成AI生成可以玩几下的互动就会改变。如果不是社交媒体,就变成了玩法驱动的产品,这类有很多的先烈了不一一举例,AI无非是加速了成为先烈的速度;这类产品没有技术壁垒。这个连harness都没有,只是套上Claude,扒热点meme批量搞内容生成然后投流,最终投资人的钱都贡献给了社媒巨头和LLM。这类产品据我了解就有七八个,还有上市公司做。烧完一波难以留下什么,所以综合结论是:快进快出,找好接盘;我觉得字节内部如果清醒的话不会花资源搞这个方向的,之前学着搞AI陪伴也是“类抖音”流式体验那一波已经吃了经验了。那堆产品里应该目前剩下Minimax的Talkie还能活着挣钱,因为用的自己的模型,有毛利,其他套壳的应该都搞不下去。

Q:你怎么看世界模型?

A:从科研角度,世界模型有不同的方向或者叫定义,有人尝试去统一总结叫预测下一个状态(不管是在虚拟世界还是物理世界)。但总体来讲,模型的训练方式无非就两种:纯video-based,是否引入3D数据、采集真实物理数据进来训练不是最关键的,最关键的是纯video的形式,训练的数据量、模型参数量有多少,因为引入的其他数据毕竟在数量级上还差得太远。那在这个角度,Google和字节显然优势巨大,搞这块的创业公司未来很难竞争;非纯video-based的,以虚拟世界的3D数据(包括游戏引擎相关的、3D高斯的等)或物理世界的采集数据(虽然也可以是视频形态,但重点是采集)来作主要训练数据。这个最大的问题就是数据量少,搞这个方向的创业就需要从数据飞轮到模型训练到产品商业化都具备,所需资源和能力要求是很高的,这样来看其实能做这块的公司不多,绝不是搞下训练demo就可以干的。所以最近世界模型很热,但不能盲目跟风;我们(Seele AI)尝试了第三条路,这条路我们从科研上已经论证了,跑出的demo在物理一致性、实时交互效果上要优于上面提到的路线2,部分优于路线1(但整体比不过Genie3,毕竟资源数量级差了好几个)。差不多近期会做一些研究成果公布。

Q: 你怎么看具身智能概念?

A:这个不用我回答了,已经有人把基座大模型的Agent装到具身里了,所以大模型可以做,不需要额外搞那么多具身智能(脑子不用,机械部分还是非常需要的)。反而关节物理、制造等才是门槛壁垒,硬件赛道的胜负手在硬件上,不能弄反了;Q: 那到底在基座大模型之外,有什么大机会?A:我一直认为对于大模型而言,差异化只有模态。你选定的创业方向里,模态是否能有优势、有壁垒?这是值得好好思考的问题。当然,不是说模态没有差异化就不能搞,回到本文开头的,那是投机,要快进快出,核心能力是营销。可不能往AGI去搞了。如果选择有差异的模态去做,那么就需要耐得住寂寞了,选的模态肯定是当下比较冷门小众关注点少的、区别于基座大模型的。但同时,也需要在执行动作上加一些投机,这个就属于增长了。

最后

再往后看,AI创业的分化大概率会越来越明显:一类继续走投机路线,靠速度、营销和窗口期赚钱;另一类则要在模态、数据、硬件或其他真正难以内化的能力上建立壁垒。前者拼的是节奏感,后者拼的是耐心和基本功。两条路都能走,但最怕的是嘴上讲AGI,实际做的却是一个没有壁垒的短周期生意。这次还是先用Q&A的方式,快速把最近被问得比较多的几个问题写下来。很多地方其实还可以继续展开,后面如果大家还想聊A2A、Agent创业、世界模型,或者AI创业、投融资相关的问题,欢迎进群交流。

Quick Q&A about AI Startup 2

03
shimu
29天前
下一代抖音,把人要笑死
21
shimu
1月前
最近在一边读加缪,一边搞ai。嗯,挺荒诞的。

D37|OpenClaw 组织落地的难点与解法

00
shimu
2月前
D8|这是我们内部用的框架,你直接拿去用

Build Seele AI with AI.今天是我们AI办公实验的第8天。前几篇发出来后,后台收到不少留言。有人问“你们到底是怎么推进的”,有人问“能不能给点能抄的”。说实话,看着这些留言,我挺开心的——说明大家真的在动手做,不是只看热闹。那今天就把我们内部正在用的东西交出来。

多图多文,请到公众号查看. p.s. 即刻啥时候可以直接方便写长文啊@kyth @瓦恁

D8|这是我们内部用的框架,你直接拿去用

40