即刻App年轻人的同好社区
下载
App内打开
OrangeCLK
587关注7k被关注14夸夸
互联网话题优秀贡献者
www.orangeclk.com
不用「您」字
不用「她」字
置顶
OrangeCLK
19天前
最近余承东重提盘古,让我想起机器之心当时的报道,摘录几段:
> 如果你是一位 NLP 从业者,你可能发现,最近的中文 NLP 社区有点热闹:「中文版 T5」、「中文版 GPT-3」以及各种大规模中文版预训练模型陆续问世,似乎要带领中文 NLP 社区跑步进入「练大模型」时代。
> 在此背景下,中文语言理解测评基准「CLUE」也经历了它的前辈「GLUE」所经历过的盛况:一个模型的冠军宝座还没坐热,就被一个更新的模型挤了下去。
> 这次刷榜的,是一个叫「盘古」的 NLP 模型。

换言之,在盘古之前,模型竞赛已经开始了,从当时的榜单图片中可以看到,参与者至少有美团、阿里、搜狗。盘古不是第一个。其实,当时GLM、CPM等也已发布,发布在悟道旗下。

可以看到,盘古的研究机构是“华为云-循环智能”,这个“循环智能”是什么公司呢?就是杨植麟的上一家公司,也就是引发投资人提起仲裁的那家公司。

机器之心这篇文章,主体就是对杨植麟的采访。而且那个时候,Moonshot的名字就已经出现了:

> 在最近的一次访谈中,循环智能 NLP Moonshot 团队向机器之心介绍了这个项目的初衷、挑战和具体的解决方案。

所以,如果想尝试原盘古团队的新作,也许可以试试Kimi Moonshot的产品。

这篇文章结尾,还记录了目前一段预言:

> 清华大学计算机科学与技术系教授唐杰在前段时间接受机器之心采访时曾表示,「超大规模预训练模型的出现,很可能改变信息产业格局。继基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于模型的 AI 时代。」杨植麟也同意这一观点。在他看来,这个新时代将有两大特征。

> 一是 AI 生产效率的变革。随着标注数据需求大幅降低,AI 生产效率将迎来两到三个数量级的提升,摆脱原来依靠大量样本的落后生产方式,进入规模化量产时代。

> 二是 AI 场景的指数级增加。技术的突破往往带来新市场,而目前 AI 商业化的现状就是需求很多但技术不一定满足。AI 预训练技术突破之后,马上可以解锁很多新场景,从数字化程度比较高的行业走向传统行业,从大型企业走向中小企业。

前述提到的比盘古更早发布的GLM模型,论文署名最后两位就是杨植麟和唐杰。

www.orangeclk.com
12
OrangeCLK
17:33
看到Semi Analysis的文章,第一段是人类的错误,第二段是agent的错误。
The claim that half of 2026 US datacenter capacity will be delayed or canceled has been circulating widely across financial and social media. This traces back to Bloomberg’s April 1, 2026 piece, America’s AI Build-Out Hinges on Chinese Electrical Parts, which framed the 2026 capacity slowdown as a consequence of a fragile, China-dependent equipment supply chain. Bloomberg didn’t lead with that framing, but within days, TechRadar, Tom’s Hardware, The Register, and other news outlets ran sharper, more clickbait versions claiming half of datacenters are cancelled, and that’s the version now circulating.

...

In our view, the culprit is obvious: the data sources behind these claims of “50% of 2026 datacenters are delayed” are essentially uninformed vibe-coded datacenter forecasts that take announcements at face value, without any bit of critical judgement. We’ve seen more and more Claude Coded datacenter models and estimates crop up, all of them wrong. Thankfully, that’s not how we built our model, which is trusted for billion-dollar investment decisions by all the world’s largest tech companies in the world, as well as energy and industrials giants, and all the largest investors on Wall Street.

Claude Code pulls press releases, views unfounded GW-scale announcements as ground truth, misunderstands construction timelines and grid complexities, and compiles a terribly inaccurate report. As resident Claude Code users spending $170K+ in just one week, we are very familiar with how to use Claude, and the mistakes others are actively publishing.

newsletter.semianalysis.com
00
OrangeCLK
2天前
00
OrangeCLK
2天前
vals.ai 之前评测过 Fable 5,在他们的 200 次测试当中,有 199 个都路由到了 Opus 4.8。但最后评估得分是 Opus 2 倍,token 消耗也是 2 倍。
21
OrangeCLK
2天前
希望凯恩能拿金球奖
20
OrangeCLK
2天前
木偶很适合肯德基翅膀
00
OrangeCLK
5天前
写得又臭又长的就是 AI 写的,特征是信息密度低。这不是 skill 能解决的。

大黑天: 你还能感觉到文章是AI写的吗? 面对越来越强大的skill。 不过这还重要吗?

74
OrangeCLK
8天前
单期播客和单期电视节目是伴随性的,可以在不知不觉中完结。
红楼梦和三国演义小说估计看完率不高,电视剧能看到最后一集的也不一定多。

瓦恁: 其实更准确的说法是,任何形式的长内容,完播率或者完成率都是最重要的指标

10
OrangeCLK
10天前
不同国家待遇不同
00
OrangeCLK
11天前
AI已经会把filter bubble翻译成“信息茧房”了,如此谬误已经被AI习得,也可以说连AI都知道人在这里犯的错误。
00