即刻App年轻人的同好社区
下载
App内打开
Chao.
687关注3k被关注13夸夸
Chao.
4天前
我是喜欢通用Agent这个概念的,在海外投过三个跟这个方向有关的团队。

但通用agent真的很难,也存在巨大的非共识,投的几家有pivot出去的,有的是pivot进来的,所幸都还在牌桌上,手上也都还有子弹。

从我的观察,通用agent的现状是即使是做到了全行业一线水平离pmf也还很远,产品成熟度也还远远不够。但新技术总是在短期内被高估,在长期中被低估,还是祝福并期待大家能做出很好的突破。
73
Chao.
11天前
“delve” - 这个词正在以病毒传播之势攻占学术圈。过去两年学术文章中的"delve"用量比过去五百年总和还多,原因是大模型对“delve”似乎有特别的偏好。

“delve into”的现代含义是深入研究,语气略显高雅、学术,大模型是在通过高频使用“delve”模仿学术深度。原来当大家在用AI假装很懂的时候,AI自己也在假装很懂。
01
Chao.
15天前
坚持游泳有一段了,最快速度一直上不去。昨天忘带运动手表,凭感觉游,结果不仅突破了,而且大幅突破。我不知道具体时长,但停车场的计时器泄露了秘密。

而今天即使戴上表,也延续了突破的速度,甚至可能比昨天更快。原来很多所谓的极限,来自于我们对数字的敬畏,是大脑对肌肉设下的结界。
00
Chao.
17天前
休假了一个多月,本周回归。先把这段欠下的新模型在CryotoBench任务上跑了一遍。

DeepSeek R1过去这个月的热度不白拿,在连o3-mini-high也超过了。

阿里的Qwen-Max也很猛,接近o3-mini水平。

黑马是Gemini-2.0-pro-exp-02-05

​下周开始试验一些放空时间琢磨的新东西。
00
Chao.
2月前
魂斗罗这种上古IP如果搞商业化,适合做哪些东西?
110
Chao.
2月前
一语成谶
62
Chao.
3月前
早上看见一个消息说Claude 3.5 Opus早已经训练完成并且运作良好,但Anthropic选择暂不发布3.5 Opus,而是用它来生成合成数据训练 Sonnet 3.5。这样sonnet在推理成本不变的情况下水平得到提升,相比直接发布3.5 opus是更优的选择。消息还未得到证实。(下附报告原文)

这种AI套娃训练如果成立,模型之间可能形成复杂的“知识生态系统”,高级模型作为“导师”训练更初级的模型,而这些初级模型在特定领域发展后,又能反哺高级模型,形成一种自我循环的智能升级体系。

我自己曾经试验过用大模型评估其他大模型,得到的结果是不错的,能够比较有效的反映出模型间的能力差异。这种'理解同类'的能力很有趣,或许意味着模型间能协同的地方会很多。

Scaling Laws – O1 Pro Architecture, Reasoning Training Infrastructure, Orion and Claude 3.5 Opus “Failures”

11
Chao.
3月前
每一个历史性时刻,都是无数微弱信号聚合成的涟漪。这不是终点,而是通往远方的下一站。
00
Chao.
3月前
有想体验perplexity的朋友可以用下面的code,免费一个月pro。能用三次,用完就没了。

It's giving season.
Below is a discount code for one month of free Pro to give to your three favorite friends and family members ($20 value each!). Simply copy the below URL and share it via your preferred communication method.
www.perplexity.ai
Friends and family can redeem this code by clicking on the link. This code expires on Monday, December 2nd.
15
Chao.
4月前
一个技术问题,如何在游泳的时候听播客?
有这样的设备吗?

过去买过的游泳耳机下水后都只能mp3模式。(携带手机下水不算答案)
100