即刻App年轻人的同好社区
下载
App内打开
以解何
66关注188被关注0夸夸
专注AI,相信AI是下个十年的变革力量
复旦- LBS
哈佛MIT交换
爱好:摄影+街舞
以解何
20天前
有人知道MLA是否能用于训练效率改进吗
论文原文只说了改进推理,但是NSA论文里说了训练推理都有帮助
此前看到MLA第三方解读说的是训练推理都有帮助
如果第三方解读是真的NSA改进幅度不大啊
如果MLA只是推理的话NSA还是大进步
20
以解何
21天前
Fact
XAI发布Grok 3, 从benchmark跑分结果和Andrej评价来看,水平约等于OAI o1 Pro模型(o3分数微弱高于Grok, 但没发布而且OAI也不打算发布了)

训练分为两阶段,第一阶段是100k H100训练122天,第二阶段扩展到200k H100上训练了92天

benchmark上还需要第三方验证,但估计问题不大computer use和知识迁移能力等benchmark XAI并未公布,需等待第三方测评结果

lmsys排名第一,但这个榜反映的是人们的偏好,不是能力的直接映射,主要受益于能力强且响应速度更快

具体应用上,Deep research模式和PPLX Deep research水平相当,不及OAI

定价上Grok 3分为Premium $16/M和SuperGrok $30/M, 分别对标ChatGPT $20/M和$200/M 的订阅

Musk宣布一周后发布语音模式
-------------
解读
XAI 19个月从0到SOTA,展示了模型能力非常快速的改进水平,XAI正式和OAI并列成为第一梯队

XAI 产品定价和估值上都大幅低于OAI,如果OAI GPT-5不能带来显著改进,要么产品订阅量下滑要么下调产品定价,全年总利润承压,下一轮融资也会很困难

幻觉和垂直领域可用性并没有因为规模扩大得到解决
00
以解何
4月前
今天测试了一下deepseek
一道复数题 o1-preview和claude都不会
deepseek做对了

叠加国内擅长挖掘需求设计解决方案
很看好2025国内AI agent应用爆发
00
以解何
4月前
网上又传scaling law到头,说是ilya认证了…
ilya说是pretraining平台期,接下来要scale the right thing. o1算是test time scale,一种scale的方向,SSI自己scale什么方向ilya没说。

媒体这么写很正常,为了流量
做投资的要是自己不思考就完蛋了
00
以解何
4月前
开卷有益- LLM
举一反三- O1
实践是检验真理的唯一标准- agent
00
以解何
5月前
Ray kurtzwell预测2029年前奇点降临,简单来说AGI到来机器智能超过人类智能
如果当不了研究AGI的一小撮人
也许能做的是赶紧去往会被AGI普惠的国家
O1签证是相对个人条件来说最快的路,晚点发个guidance for O1
00
以解何
5月前
刚用了一下Computer use api 提起数据
感觉2B有很多business都可以用这个做
以前在投行干活很多任务就是到手的函证录入Excel
有了这个api可以做到拍照上传然后自动完成后面的录入api
以后有了通用机器人可以直接拍照也automate
虽然本质上这个函证验证可以用新的加密方式来verify

当时在投行的时候就觉得这些活太傻了从网上找了一个开源的方案automate了这个工作
现在相当于技术门槛进一步降低不会写码也能做这个

未来已来,只是分布不均
00
以解何
5月前
Ray dalio对中国上周经济政策的点评要点:
中国最高领导人、Politburo、CSRC、PBoC 宣布一揽子财政和货币政策刺激经济 2.发表讲话支持自由市场,终止去杠杆导致的通缩并刺激生产力。结合之前中国资产很便宜,引爆了股市。
dalio认为中国政策制定者如果真的要挽救经济,还需要比现在宣布的更多的政策
如果处理的好,可以在去杠杆的同时提高生产力
如果没处理好可能会和日本一样失落

一些note:
Politburo: 政治局,管政治经济决策
CSRC: China Secuirites Regulatory Commission,类似SEC in US
debt structuring: change terms of how debt are repaid. 重要是因为债务如何重组决定了财富分配。比如之前政府向优质企业借钱,与此同时优质企业也依赖政府支出提供的良好公共设施。如果这个钱还不上了,谁承担损失。
dalio认为这是因为中国税务体制不完善,所以公共支出只能通过借钱来,现在解决债务重组的时候还需要改革税务体制。

my comment:
上周还有很多人说基本面没改善是泡沫,dalio认为中国资产当时很便宜,所以认为是修复估值的逻辑。叙事在股市中真的也很重要

https://www.linkedin.com/pulse/beautiful-deleveraging-chinese-characteristics-ray-dalio-d7aue/?trackingId=RBZnsTaRReiZCtnfx5eZgA%3D%3D

00
以解何
9月前
扒了2000-2022年上海统计年鉴商品房销售情况
2000年-2022年上海房价翻了11倍,CAGR是11.6%
作为参考,标普500在同一周期年化收益5.5%
小笼包2000-2022年价格翻了4-5倍,略跑赢标普500
91
以解何
9月前
费曼测试自己对时间的感知
自己数48下是一分钟
与此同时他可以阅读但不能发声
所以他锻炼出来 一分钟后告诉别人一分钟到了这篇文章大意
他和同事交流这一发现
同事表示不相信他能阅读,并表示一遍计数来度量时间的流逝一边说话有什么难的
同事真的能数到52下同时一边说话
抛开大家对时间的感知
他们比较了两个人的计数过程,得出结论
1.他们计数度量时间时候能干的事情不同是因为对于费曼来说计数是声音计数,如果与此同时发声就打断了计数声音,但是阅读是眼睛在看。(我应该也是这种)同事计数是仿佛眼前有一个跳动的计数器,如果阅读就不能看到计数屏幕了,但是他的声音线程空着随意可以说话

费曼说所以每个人看世界看到的都是自己翻译的世界,沟通起来你觉得显然对方却不能理解,根本是因为你们大脑运作方式不同

我的感想是好神奇,大师在玩中发现差异,寻找原因增进对世界的理解。看费曼纪录片真的很解压(晚上的话不要太在意看不懂的知识,激发兴趣为主)
20