即刻App年轻人的同好社区
下载
App内打开
liupc
349关注1k被关注4夸夸
一个有趣的人

英雄以宁静的心、凶猛的剑,奋勇战斗,委身于杀伐和死亡
置顶
liupc
10月前
在所有「现实世界锚定强度高」的领域,AI 都需要和人类协作来推进具体任务,并在海量具体任务推进过程中,形成一套全新的数字化系统,让对应领域的人类-AI 认知重叠度不断提升,不断挤压人类优势区域,同时放大人机共生区。

2025年6月关于 AI 的一些想法

12
liupc
1天前
假期读《彭德怀自述》。
早年经历如此艰难,九死一生。但阅读时因为知道是回看,总是曲折,也总有一种百转千回的期待。
到后来闻名于世,万言书激昂澎拜,却不免凄惶之感。

想起少年时读《三国》,过五关斩六将、古城相会,携民渡江、长坂当阳奋孤勇,虽也充满困顿,但一股浩然英雄气撑着,一场小胜的欢欣鼓舞便能盖过大败之后的低迷。
而到了水淹七军,虽然威震华夏,但因为离英雄末路越来越近,总让人不忍卒读。

大概这就是佛家所云的一种轮回,去时的路,和回来的路。
00
liupc
3天前
非洲塞内加尔抵达巴西纳塔尔的球面直线距离约2600公里。
什么概念?和北京直飞拉萨的距离差不多。

但是因为国际地理区划的划分,以及中国印制地图的展开方式,绝大部分没有实地走过南美和非洲的中国人,可能潜意识里都觉得这是两个相隔万里的地方。

地图的画法把很多错觉刻在人的脑海里。
这也造成了一些衍生的后果:“大西洋两岸”这个地理描述以及背后的文化意识构建,似乎总显得没有“太平洋两岸”那么直观。
00
liupc
3天前
大型群体赢学现场。

最近几年,越来越觉得社会科学和对应实践领域里,主观和客观的关系越来越复杂:
“这个世界是什么样的”
VS
“人们相信这个世界是什么样的”
很难说谁在决定谁。

https://www.zhihu.com/question/2029706313282625696/answer/2033320701516629488?share_code=1oyC8i9NjWPHo&utm_psn=2033887915118473820

00
liupc
7天前
对星阵7D的一盘大杀局,差一点杀崩了…
幸好关键时候有妙手!
00
liupc
7天前
对未来的想象力,很多人有误解。

一个典型例子是,基于 AI coding 能力的一日千里,认为未来的企业软件会成为日抛品。
这个想象,神似认为自由就是不受约束。

实际错得离谱。
企业软件的实质是作业流程的数字化载体,是企业业务数据积累的重要来源,是人和系统交互的关键界面。
日抛的企业软件,抛弃的不止是 AI 生成的那一段看似廉价的代码,而是业务数字化系统的底座,企业私有数据生产链路的源泉,使用系统的用户心智资产池。

什么?你认为未来的企业作业流程都是面向 AI 的,不需要人了?
哦,好,失敬。
你说得都对。
10
liupc
8天前
杀鸡给猴看。
被抓鸡了…
10
liupc
8天前
如果你是一个编剧:
如何在不真实发布那个模型的前提下,让主流用户相信你们已经开发出了历史上最强大的模型?

从这个视角看,谁是更优秀的编剧?
11
liupc
8天前
忽然想到,Claude的奇点时刻,可能并不在技术上,而在用户心智上。

当他们占领了最核心用例贡献者的“Claude是最好模型”心智,源源不断的高质量用例,通过管道流入,结合准自动化的AI编码能力,游戏就结束了。

他们甚至可以做到,在并不真发布一个模型的前提下,让目标用户群相信,那里有一个他们已经创造出来的sota模型。
01
liupc
8天前
这篇点名了,这波幽灵蛋糕店捅马蜂窝的平台是京东。虽然最后的处罚,为醋配饺子的是拼多多。

细想想也合理:
多多的用户既不会给幽灵蛋糕店留那么大的套利空间,也不会对商品质量预设那么高的期望。

改变历史的一个京东订单

00
liupc
8天前
关于 token 定价,一个重要的约束条件是:智能水平的迷雾。
实际上,几乎没有什么角色清楚地知道不同模型在不同场景下的智能水平对比。
人的体感和心智都过于感性和容易被经验及观念传播误导。

一个的真实例子:四岁的小朋友左膝盖晒在阳光下,右膝盖在阴凉处。一段时间后,他发现左膝盖比右膝盖热,然后摸了一下,发现真的是这样。

这个描述的背后,有三种方式来确认两个膝盖的温差:
一是大脑神经直接连接两个膝盖,形成对比;
二是两只手分别摸到两个膝盖,然后对两只手的末梢神经信号进行对比;
三是用一只手分别摸两个膝盖,然后进行对比。

这三种模式移植到模型应用场景的智能水平对比时,都有显著的局限性:
模式一的问题是,并不存在一个中央模型能评价各个不同模型厂商;
模式二的问题是,「两只手」的尺度不一定统一,实际上真实操作是靠测试集,测试集本身存在显著的局限性;
模式三的问题是,对同一个任务采用不同模型进行多次测试度量,很难构成精确的 A/B 测试。

也许我们在度量模型的智能水平和对应的商业价值时,不得不放弃一劳永逸的诉求,去寻求有误差但可行的场景化度量和分层对比机制。
00