即刻App年轻人的同好社区
下载
App内打开
志达
460关注8k被关注7夸夸
把学到的东西用费曼的方式写出来
上一次创业是老虎证券
早年在阿里,美团,豌豆荚写代码
志达
2天前
习惯的改变还是缓慢的,每天还是看到大量的用户,在留言或者找客服提问关于模型的使用问题。

你都用上最强模型了,你都愿意把问题用文字描述出来了,为什么不先问问模型呢?
00
志达
3天前
Codex OSS Mode 这步挺妙。

OpenAI 直接让 Codex 接入开源模型、本地 Ollama,只保留 Responses API 协议入口。Dario 越想把 Claude Code 收进围墙里,OpenAI 越把门打开。

「每与操反,事乃可成耳。」
42
志达
6天前
DeepSWE 6.11 最新榜单,可惜没有 fable 的成绩,国产模型,kimi,minimax,mimo,qwen 都是最新模型出战了,差了个 glm-5.2 的。
好消息是,国产模型摸到 opus-4.6 的门槛了,但实际成本没差多少。
坏消息是,gpt-5.5 和 fable-5 又拉开了更大的差距。
谁能想到 gpt-5.5(medium)成了性价比之王呢…
deepswe.datacurve.ai
26
志达
7天前
codex 放开手让中转薅的形势来看,他们是想把日活和 token 消耗量在上市前拉到比 claude code 高了…
43
志达
8天前
难受,超量写入居然能把 raid 里的三个硬盘同时写坏了…服务第一次宕机这么久…
40
志达
9天前
primitive 翻译成「原语」
的确不是个好翻译…
10
志达
10天前
Datacurve 新出的 DeepSWE,题目全部从零手写,不像之前题目来自于GitHub 公开 PR,这个测试集分差拉的很大。
Top 5:GPT-5.5 70%,GPT-5.4 56%,Opus 4.7 54%,Sonnet 4.6 32%,Gemini 3 Flash 28%

Kimi K2.6 24%,MiMo-V2.5-Pro 19%,GLM-5.1 18%,DeepSeek-V4-Pro 8%。
强烈建议国产模型公司,针对这种歧视行为,拿起法律武器,坚决维护自身权益。
19
志达
10天前
耐着性子看了钉内,看完只有一种感觉。

一个上个时代的 pm,用上个时代的文笔,描述上个时代的领导。他们在上个时代的公司,服务上个时代的客户,自己也停留在上个时代的逻辑里。

真把发布时间改到2016 年,我觉得没有任何违和感。
227
志达
11天前
魔幻的第一层是,两个市值千亿的大模型公司的营收,国内随便几个头部中转站的收入都能轻松吊打,更别提利润了。

魔幻的第二层是,中转的价格已经卷到 1 折可开票的 gpt-5.5 了,跟国产大模型的价格真差不多了,还有人要 token 出海呢…

铁拳的故事还是会一再上演吧…
76
志达
11天前
什么时候能出一个正经的模型自媒体,类似硬件自媒体测硬件一样,不用搞什么播客访谈,就部署和复现这些模型以及他们自己 pr 的测试集,就上周的 opus-4.8 minimax-m3 的复现测试,我保证期期都是国际爆品。
63