即刻App年轻人的同好社区
下载
App内打开
志达
331关注6k被关注8夸夸
把学到的东西用费曼的方式写出来
上一次创业项目是老虎证券
早年在阿里,美团,豌豆荚写代码
志达
1天前
原来雅尔塔会议的地点: 雅尔塔 yalta,就在克里米亚岛上!

克里米亚的确是个兵家必争和流量之地,从 1853 年的克里米亚战争走出来南丁格尔和细细的红线…命名了巴黎的塞瓦斯托波尔大道。
再到二战期间德国的巨型大炮「古斯塔夫」和「多拉」…
再到二战结束前的雅尔塔会议。
再到 14 年的克里米亚被吞并以及后来俄乌战争中莫斯科号被击沉和克里米亚大桥被炸断。

如果该地能回归和平,还真想去看看,希望有一天能以度假胜地的角色回归到公众视野吧。
00
志达
4天前
来自@howie_serious 的提示词启示。
我发现每次问,ai 的视角都不一样,但每次都挺切中要害。claude 更关注人和人之间的关系,而 gpt 更关注的是人和客观世界的关系
012
志达
4天前
恶性通货膨胀有一个小优点,就是本币计价的历史欠款可以一笔勾销…

通胀前的债务不管欠多少,总可以用几张津巴布韦级别面值的钞票了账。
20
志达
4天前
说实在的,没感受到 ChatGPT-4.5 的提升,但 sonnet-3.7 是真的强。
claude artifact 功能发布都快一年了,至今仍然独孤求败。
72
志达
7天前
试了下用市面上所有的推理模型具体分析一份合同的违约责任和可能产生的违约成本,里面设计了多个违约条款的抵扣。

表现可以分为 3 档:

第一档 Google aistuido gemini 2.0 flash thinking,没有遗漏和计算错误的地方。
第二档 Grok think DeepSeek r1 都遗漏了抵扣条款,但是都能把其他的费用计算清楚。
第三档 o1/o3-mini,表现最不好,虽然提到了抵扣,但完全不会从合同里面提取具体金额代入进行计算…

sonnet-3.7 无法分析扫描的 pdf 文件,遗憾退赛。
gemini 收了费但是还是不支持文件,远不如自家免费的 aistudio
51
志达
7天前
有点沮丧,自己已经找不出可以测量超过 o1 pro/sonnet-3.7 level 以上的测试 prompt 了,第一次感觉到自己被 ASI 了…

发现一个悖论,就是模型本身无法提出超越自身智能水平能回答的问题。

你没法让一个模型生成一段这样的提示词,这段提示词的答案是模型无法正确回答的。
01
志达
7天前
agi 时代最重要的问题,是 what should be achieved,而不是 how。
AI 「怎么做」上,会超越人类,而「做什么」,需要人来提供。
我只是觉得 agi 之前的我们反而活在「手段」的牢笼里,其实「目的」才是更重要的,只不过我们被自己的智能限制在个人能力的边界里,把自己训练成一个知道 how 的人形 agent,希望别人来给我们提供目的和报酬。

李继刚: 我们习惯了认为自己的意图是清晰的,只是被交互的复杂性所阻碍。 但当阻碍消失,才惊讶地发现:我们并不总是知道自己真正想要什么。 面对 Reasoning Model,我们丢掉了「如何做」的缓冲,将直面自己赤裸的意图。就像有一个聚光灯打在我们眼部,一个声音响起:「你想要什么?」 有多少人能够承受直接面对这个问题的重量? 当世界变成我们意图的即时反映,它还是那个能给我们提供抵抗和意义的世界吗? 如果我可以做任何事,我的想要本身又将如何变化?

01
志达
7天前
2233.ai 上线了 claude-3-7-sonnet-20250219

aws bedrock 资源还在申请,希望不被封吧。
01
志达
8天前
claude sonnet 3.7 终于来了,同样带了类似推理模型的 extended thinking 功能。感觉 claude 的编程能力的优势更大了…
01
志达
8天前
2080ti 22G 显存魔改版之后的华强北又一神卡。
4090 96G 显存魔改版
应该是 12 个原来的显存芯片先脱焊,然后换了 8G 显存,如果是自己用,这下单机满血问题不大了。
22