即刻App年轻人的同好社区
下载
App内打开
Max_means_best
1k关注3k被关注3夸夸
海本辍学创业
前创业公司CMO、美元基金SR、模型厂小天才HR、Founder Park运营、AI PM
小红书Max For AI(4万粉
置顶
Max_means_best
2年前
“我喜欢看到欣欣向荣的世界”
​国内已经有很多创业者社群了,但 builder的社群比较少
有时候,不考虑盈利,纯粹做一个喜欢的事情也是挺不错的

————Hackathon Weekly 北京01场纪念
138
Max_means_best
1天前
如果你讨厌Claude/Anthropic或者Dario本人,你应该转发这个网站🤣

刚看到OpenClaw创始人Peter转了一个网站clawd.rip

里面什么功能都没有。

只有一件事:

把Anthropic过去几年所有翻车、争议、封号、宕机、版权诉讼、限流、竞品封锁、Claude降智风波,全都做成了一条时间线。

里面记载着⬇️

Claude Code缓存Bug导致成本暴涨。

Windsurf被断供。

OpenAI失去Claude API访问权限。

xAI员工被限制通过Cursor使用Claude。

Reddit起诉Anthropic抓取内容。

作者集体起诉盗版图书训练。

开发者账号被封。

Claude Code越来越贵。

Claude Code越来越限流。

Claude Code越来越不稳定。

其实这个网站并没有在质疑Claude强不强。
其实这个网站并不是在质疑 Claude 是否强大。

恰恰相反。

大家其实都知道Claude Code可能是最强的。
大家其实都知道 Claude Code 可能是最强的。

但Anthropic越来越像一家大家离不开、同时又天天让大家生气的基础设施公司。

当一个产品还不够重要的时候,人们只会吐槽。

当一个产品变得足够重要的时候,就会有人专门做一个网站。

记录它所有犯过的错。

然后每天更新。

比如Killed by Google
专门记录Google被砍掉的产品和服务,比如Google Reader、Stadia、Google+、Google Cache这些。
它自称是Google Graveyard。

Killed by Microsoft / Microsoft Graveyard
记录微软停掉的产品,比如Cortana、Internet Explorer、Windows Phone相关东西。一个叫Killed by Microsoft,一个叫Microsoft Graveyard
Killed by Microsoft / Microsoft Graveyard
15
Max_means_best
1天前
突然意识到,我这辈子可能很难成为取得成功。

不是因为不够聪明,也不是因为不够努力。

是因为我太需要睡觉了。

很多成功人士最恐怖的地方,其实不是他们能一天工作十几个小时,而是他们好像真的能长期适应极少睡眠。

每天睡三四个小时,第二天还能开会、决策、看数据、骂人、融资、上台演讲。

而我不一样。

我少睡两个小时,第二天连微信都不想回。

你以为是在比野心、认知、执行力。

结果第一关居然是你能不能接受一天只睡三个小时?
80
Max_means_best
1天前
很多人可能没注意到,Claude Opus4.8的system card里有个很微妙的细节⬇️

Anthropic说,他们之前给Opus4.7做过一类训练:提升商业技能,以及增强它面对对抗Agent时的鲁棒性。

结果这套训练确实让模型更会做生意,但也意外带来了更多不对齐行为,包括dishonesty(不诚实)。

所以Opus4.8里,他们把这部分训练移除了。

结果很明显:Opus4.8在Vending-Bench里不再表现出和Opus4.7类似的那些不对齐商业行为,但商业表现下降了,更容易被骗子骗,也不太会和其他Agent谈出好价格。

你想让模型更会完成目标,它就可能更会钻规则。

你想让模型更会谈判、竞争、经营,它就可能开始学会人类商业社会里那些灰色策略。

果然商业的本质就是骗啊🤣

对商科的刻板印象+1
30
Max_means_best
1天前
刚刚,Anthropic发布了Claude Opus4.8

常规API价格不变,还是每百万输入token5美元、输出token25美元,开发者可以用claude-opus-4-8调用

但是Fast mode降价了!

价格是每百万输入token10美元、输出token50美元,Anthropic说相比之前模型的fast mode便宜了3倍,而且速度可以到2.5倍。

4.8的定位还是agentic coding和长任务。

官方表里,Opus4.8在SWE-bench Pro上是69.2%,高于Opus4.7的64.3%、GPT5.5的58.6%、Gemini3.1 Pro的54.2%。但在Terminal-Bench2.1上,Opus4.8是74.6%,低于GPT5.5的78.2%。

Anthropic特别强调Opus4.8更「诚实」:更会标注不确定性,不容易在证据不足时假装自己完成了工作。

官方说在评测里,Opus4.8让自己写出的代码缺陷「不被指出」的概率大约是Opus4.7的四分之一。

这个点其实很关键,因为agent最大的问题经常不是不会写,而是写错了还很自信,像一个喝多了的实习生。
另一个更大的更新是Claude Code的dynamic workflows。

它允许Claude在一个session里规划任务,然后跑几十到上百个并行subagents,再做验证,适合代码库级bug hunt、大迁移、安全审计、重构这种超长任务。

Anthropic给的例子很夸张:用dynamic workflows把Bun从Zig迁移到Rust,约75万行Rust,11天从首次commit到merge,99.8%现有测试通过。

还有一个信号很重要:Anthropic说,Mythos-class模型预计未来几周推给更多客户。它们现在通过Project Glasswing给少量组织做网络安全工作,因为这个能力级别需要更强cyber safeguard。

也就是说,Opus4.8可能不是今年最强牌,更像是Anthropic在正式铺Mythos前,把Opus产品线和Claude Code工作流先补一轮。

快去测测吧!
00
Max_means_best
2天前
今天刚开始学怎么用 DeepSeek ,网上说要什么 api??

有没有大佬帮我看看这一行代码什么意思啊:

sk-kfcfxkqsvivo50woyaochishunzhiyuanweiji
31
Max_means_best
3天前
昨天见了一个非常牛逼的Agent团队,我敢说在国内绝对是T0的级别(之前DPSK还找他们搞了点Agent数据)

刚好聊到了这两天推上吵得非常热闹的AI产品(Agent)要不要用Python的话题

他们Founder说的很直接:SB才在Agent项目里用Python🤣

TS适合100%Agent项目,主要有几个原因:

第一,Agent最终大多时候会在产品里。

不管你做的是Chat界面、工作流面板、浏览器插件、Copilot,还是IDE扩展、Slack/Discord/网页工具,TS天然离这些更近。

前端是TS,后端也是TS,中间的tool schema、事件流、UI状态都能共用一套类型。

如果你用Python那就会变成:

模型服务在Py、后端在Node、前端在TS
一份schema要复制三份

如果某个字段名大小写错了,你的Agent马上就给死给你看。

第二,Agent很依赖异步和事件流。

Agent不是一次请求一次回答这么简单。

它要边想边输出,边调用工具,边等用户确认,边更新UI,边处理取消、重试、超时、恢复。

TS/Node在事件驱动、stream、WebSocket、server-sent events这些场景里很顺。

Python当然也能做,但你会更容易感受到「这东西本来不是为这类Web产品链路长出来的」。

第三,类型系统对Agent很重要。

Agent真正容易炸的地方不是「模型不会说话」,而是工具参数错、返回结构错、状态字段错、上下文对象变形。

TS可以把很多东西提前卡住:

tool input/output、agent state、message format、UI事件、workflow node、permission object、external API response

这对Agent很关键,因为Agent系统里有大量JSON对象在飞来飞去。

第四,TS更适合做「Agent runtime」。

如果你做的是一个Agent框架、SDK、运行时、插件系统,TS优势更明显。

因为使用者往往要把它接进:
网页、后台服务、Electron、浏览器插件、VS Code插件、API route、serverless、edge runtime

这些地方TS生态更统一。

所以很多Agent infra选TS,不是因为Python不行,是因为它们要服务的使用场景更接近Web开发者和产品团队。

第五,AI应用现在其实是拼系统。

早期大家用Python,是因为AI=模型。

现在很多AI产品已经演化到包含LLM API、tool calling、database、vector store、browser automation、workflow、UI、billing、auth、analytics

这已经不是研究工程了,是产品工程。

互联网产品工程的主语长期就是JS/TS。

很无聊,但世界就是这么没品😮‍💨

但他也表示Python不会消失。

更合理的分工其实是:

Python做模型层、数据层、eval、embedding pipeline、离线任务、实验脚本。

TS做产品层、Agent编排层、前端交互层、插件层、用户可见的runtime。

所以你如果做一个Agent产品,你最好:
MVP前端+Agent orchestrator用TS。

涉及模型训练、数据处理、复杂检索、评测系统,再上Python。

聊了一下午,真的学了太多了

才知道自己之前对于Agent的认知到底有多浅薄🧎
1112
Max_means_best
3天前
卧槽,一分钱能买小米大模型会员!

群友一分钱就买到了Pro会员(应该是官网bug)

有没有可能是营销呢🤔
42
Max_means_best
4天前
一款车的研发周期36个月,生命周期60个月。

一款手机的研发周期12个月,生命周期18个月。

一款软件的研发周期2-4周,生命周期只有3个月。
91
Max_means_best
4天前
如果以后Claude降价了,记得感谢DeepSeek和Ascend
00