即刻App
年轻人的同好社区
下载
App内打开
志达
460
关注
8k
被关注
7
夸夸
把学到的东西用费曼的方式写出来
上一次创业是老虎证券
早年在阿里,美团,豌豆荚写代码
志达
2天前
习惯的改变还是缓慢的,每天还是看到大量的用户,在留言或者找客服提问关于模型的使用问题。
你都用上最强模型了,你都愿意把问题用文字描述出来了,为什么不先问问模型呢?
11
0
0
志达
3天前
Codex OSS Mode 这步挺妙。
OpenAI 直接让 Codex 接入开源模型、本地 Ollama,只保留 Responses API 协议入口。Dario 越想把 Claude Code 收进围墙里,OpenAI 越把门打开。
「每与操反,事乃可成耳。」
22
4
2
志达
6天前
DeepSWE 6.11 最新榜单,可惜没有 fable 的成绩,国产模型,kimi,minimax,mimo,qwen 都是最新模型出战了,差了个 glm-5.2 的。
好消息是,国产模型摸到 opus-4.6 的门槛了,但实际成本没差多少。
坏消息是,gpt-5.5 和 fable-5 又拉开了更大的差距。
谁能想到 gpt-5.5(medium)成了性价比之王呢…
deepswe.datacurve.ai
17
2
6
志达
7天前
从 codex 放开手让中转薅的形势来看,他们是想把日活和 token 消耗量在上市前拉到比 claude code 高了…
16
4
3
志达
8天前
难受,超量写入居然能把 raid 里的三个硬盘同时写坏了…服务第一次宕机这么久…
2
4
0
志达
9天前
primitive 翻译成「原语」
的确不是个好翻译…
2
1
0
志达
10天前
Datacurve 新出的 DeepSWE,题目全部从零手写,不像之前题目来自于GitHub 公开 PR,这个测试集分差拉的很大。
Top 5:GPT-5.5 70%,GPT-5.4 56%,Opus 4.7 54%,Sonnet 4.6 32%,Gemini 3 Flash 28%
Kimi K2.6 24%,MiMo-V2.5-Pro 19%,GLM-5.1 18%,DeepSeek-V4-Pro 8%。
强烈建议国产模型公司,针对这种歧视行为,拿起法律武器,坚决维护自身权益。
26
1
9
志达
10天前
耐着性子看了钉内,看完只有一种感觉。
一个上个时代的 pm,用上个时代的文笔,描述上个时代的领导。他们在上个时代的公司,服务上个时代的客户,自己也停留在上个时代的逻辑里。
真把发布时间改到2016 年,我觉得没有任何违和感。
101
22
7
志达
11天前
魔幻的第一层是,两个市值千亿的大模型公司的营收,国内随便几个头部中转站的收入都能轻松吊打,更别提利润了。
魔幻的第二层是,中转的价格已经卷到 1 折可开票的 gpt-5.5 了,跟国产大模型的价格真差不多了,还有人要 token 出海呢…
铁拳的故事还是会一再上演吧…
33
7
6
志达
11天前
什么时候能出一个正经的模型自媒体,类似硬件自媒体测硬件一样,不用搞什么播客访谈,就部署和复现这些模型以及他们自己 pr 的测试集,就上周的 opus-4.8 跟 minimax-m3 的复现测试,我保证期期都是国际爆品。
14
6
3