即刻App
年轻人的同好社区
下载
App内打开
PakyuM
2k
关注
14k
被关注
25
夸夸
互联网领域优秀贡献者
所有言论与供职机构无关
置顶
PakyuM
4月前
废物朋克 2024 年更新上线,希望给大家返程时光带来愉悦
这是废物朋克的第五年,下一个五年我们不见不散
Xinyang: 简中互联网没有王泽了,需要一个AI王泽伴侣
28
5
1
PakyuM
2天前
字节跳动连自己引以为傲的简体中文审核业务都溃败的这么严重吗?
看起来官僚主义真的是每个大公司都不可避免需要面对的系统性问题
以及官僚真的会让人/组织变得愚蠢
OrangeCLK: 打开豆包智能体页面看到这个
11
1
1
PakyuM
9天前
你司在银河系有两百万员工,但是不如一个离职员工懂
王二鹅ERE: 效率,可以说是“把事情做对”(to do things right)的能力,而不是“做对的事情”(to get the right things done)的能力
9
0
2
PakyuM
9天前
欧洲什么时候开始监管?
阑夕ོ: Kimi和DeepSeek的新模型这几天内同时发布,又是一波让人看不懂的突飞猛进,硅谷的反应也很有意思, 已经不再是惊讶「他们是怎么办到的」,而是变成了「他们是怎么能这么快的」,就快走完了质疑、理解、成为的三段论。 先说背景。大模型在运作上可用粗略分为训练和推理两大部分,在去年9月之前,训练的质量一直被视为重中之重,也就是通过所谓的算力堆叠,搭建万卡集群甚至十万卡集群来让大模型充分学习人类语料,去解决智能的进化。 为什么去年9月是个关键的转折点呢?因为OpenAI发布了GPT-o1,以思维链(Chain-of-Thought)的方式大幅提高了模型能力。 在那之前,行业里其实都在等GPT-5,以为一年以来传得沸沸扬扬的Q*就是GPT-5,对o1这条路线的准备严重不足,但这也不是说o1不能打,它的强大是在另一个层面,如果说训练能让AI变得更聪明,那么推理就会让AI变得更有用。 从o1到o3,OpenAI的方向都很明确,就是变着法儿奔向AGI,一招不行就换另一招,永远都有对策,大家平时对于OpenAI的调侃和批评很多,但那都是建立在高预期的前提下,真不要以为OpenAI没后劲了,事实上每次都还是它在推动最前沿的技术创新,踩出一条小径后别人才敢放心大胆的跟上去。 AI大厂们一直不太承认训练撞墙的问题,这涉及到扩展法则(Scaling Law)——只要有更多的数据和算力,大模型就能持续进步——有没有失效的问题,因为可被训练的全网数据早就被抓取殆尽了,没有新的知识增量,大模型的智能也就面临着无源之水的困局。 于是从训练到推理的重点转移,成了差不多半年以来最新的行业共识,推理采用的技术是强化学习(RL),让模型学会评估自己的预测并持续改进,这不是新东西,AlphaGo和GPT-4都是强化学习的受益者,但o1的思维链又把强化学习的效果往前推进了一大步,实现了用推理时间换推理质量的正比飞跃。 给AI越充分的思考时间,AI就能越缜密的输出答案,是不是有点像新的扩展法则?只不过这个扩展在于推理而非训练阶段。 理解了上述背景,才能理解Kimi和DeepSeek在做的事情有什么价值。 DeepSeek一直是「扮猪吃老虎」的角色,不但是价格战的发起者,600万美元训练出GPT-4o级模型的测试结果,更是让它一战成名,而Kimi正好相反,它的产品能力很强,有用户,甚至还为行业贡献了足够的融资八卦,但在科研方面,除了都知道杨植麟是个牛逼的人之外,其实还是不太被看到。 这次就不一样了,DeepSeek不再是一枝独秀,Kimi也把肌肉秀到了人家脸上,Kimi k1.5满血版在6项主流基准测试里和o1同台竞赛,拿到了3胜1平2负的结果,已经完全称得上是平起平坐了。 Kimi在GitHub上开源了k1.5的论文,分享了实现原理,最重要的一条是long2short,什么意思呢,就是让长思维链模型去当老师,教会短思维链模型同样的思考方式。 类o1的思维链模型什么都好,就是成本太高了,对于大多数普通人来说,「用得上但用不起」是最大的障碍,所以只有能够把AI用作生产力的专业人员,才能「回本」,甚至连OpenAI都没法通过高定价达成盈亏平衡,Sam Altman说200美金/月的ChatGPT Pro——可以毫无心理负担的使用o1——在账面上是亏损的,因为o1被调用的频次太高了⋯⋯ 如果说DeepSeek V3是在训练层戳破了必须要囤上几万张卡才能上牌桌的神话,那么Kimi 1.5就是在推理层推翻了思维链含着金汤匙出生就是要烧钱换质量的判断。 long2short也有点模型蒸馏的意思,本质上是利用极致的压缩能力实现「降本等效」的需要,k1.5分为long-CoT(长思维链)和short-CoT(短思维链)两个版本,但是很明显的,相比long-CoT对于长板的挑战,short-CoT对于短板的补足价值更有吸引力。 简单来说,就是和包括DeepSeek V3在内的竞争对手比起来,达到同样的水平,Kimi k1.5消耗的token量最少,如果把可消耗的token量提高到同一数值,Kimi k1.5的表现又回一骑绝尘,同质量最便宜,同价格最优质,就是这么不讲道理。 Kimi的论文里强调了长上下文的压缩是这套long2short方法的关键所在,这就有点让人感慨了,不知道你们还记不记得,Kimi当初的出圈,就是因为对长上下文的支持,刚发布时的20万字处理上限,刷新了行业纪录,后来长上下文也一直是Kimi的特色标签,但谁又能想到,对于长上下文的压缩优势,还能穿越山海,让Kimi在思维链的长短压缩场景里也能复用。 更早些时候,晚点对MiniMax创始人闫俊杰的采访里,闫也说了,公司采用全新架构的原因,就是意识到长上下文很重要,它是大模型发生通讯的核心能力。 只能说,过去的一切积累都会成为未来的慷慨馈赠。 和中美人民在小红书里重新相遇很像,两个国家在AI技术上的交流和互动其实也很密集,虽然政治上有芯片禁售等情况,但在从业者的圈子里,看不到太多的意识形态,腾讯的财报会议直接都说了,几乎全公司的程序员都在用Copilot写代码,而DeepSeek和Kimi把模型成本打下去的动作,也证明了在经济易用这条路上,国产公司是走得最远的。 这就勾画出了一个非常明确的趋势,美国的AI厂商负责前沿探索,烧最多的钱,出最好的货——你可以发现目前o3还是同行们不敢碰瓷的,都会默默绕开,哈哈——中国的AI厂商负责务实,在更贴近现实需求的领域里,提供最全面的优化,让AI变得好用。 这真的是未曾想过的配合。 朋友圈里有人转过一张群聊截图,我觉得很符合AI发展的方向,内容是宝玉发了一个react动画库的网址,下面的消息回复是:「谢谢推荐,我让Cursor学习下。」 哥飞对此感慨道:注意到区别了吗?如果是在以前,这个回复应该是「谢谢推荐,我学习下」。 时代就是这么悄然改变的。
3
0
2
PakyuM
11天前
店長: 我们亚洲~
3
0
0
PakyuM
11天前
斗转星移
中国新四大发明已经是
电动车,光伏,无人机和小红书了
为什么我眼里常含泪水
PakyuM: 为小红书担心,今年好不容易赚的利润不会又全花在买大模型和机器上吧 真不容易 赶紧找个懂的人带路吧
20
1
3
PakyuM
11天前
我会开始写近距离看美国
瓦恁: 林达看到这个周末的美国,会不会想重新写一本书
8
0
1
PakyuM
12天前
为小红书担心,今年好不容易赚的利润不会又全花在买大模型和机器上吧
真不容易
赶紧找个懂的人带路吧
PakyuM: 大家不是都担心小红书审核吗 那啥 谁给超哥带个话,我这有一身绝活没处使 可以帮忙解决这个问题
13
3
2
PakyuM
12天前
OrangeCLK: 2025年1月7日,Meta宣布停止事实核查。 事实核查这个词,在美国已经成为和特朗普支持者对立的一个概念。因为特朗普支持者不愿意接受事实核查。 半个多世纪以来,主要政党的总统候选人在10月都会参加CBS的60分钟节目,但这轮大选特朗普取消了节目,给出的第一个理由就是不愿意接受事实核查。 取消事实核查,是特朗普支持者对社交媒体的呼吁。 这也让社交媒体和新闻媒体进一步分道扬镳,严肃新闻媒体关注真实性,但社交媒体一直没那么需要。Meta近年也降低了新闻内容的权重,分叉早已在路上。顺便一提,我很赞同Meta降低新闻内容权重的做法,事实上Meta给新闻内容降权之后,受到打击最大的就是寄生于Facebook平台的黄色小报——比如每日镜报,这对于社区的整体信息质量我觉得是优化。严肃新闻报道不那么耸人听闻,缺乏原始的吸引力,能激起转发和流量的往往是黄色新闻内容。Meta给新闻内容降权,也能规避社区内纷乱的吵架。吵成一锅粥,参与各方与社会其实都并没有收益——也许有短期的流量收益。纠错也经常是火上浇油,因为不信的人给他核查了信息可能还更破坏信任,不如干脆避免。就像八年前微博从新闻转向娱乐,但微博的娱乐打榜之路后来受到挫折,现在新闻与政治内容还是挺多的,不知道Facebook将来命运如何。 即便在过往社交媒体表面上支持事实核查的日子里,社交媒体也依然是错误信息肆虐的地方,很难说他们的事实核查计划有多大程度是表演性的,是不是只是应对政治压力做的表面功夫。 Meta现在取消事实核查,我想也是一种应对政治压力的表现,安抚或者示好特朗普支持者。就在1月,Meta任命了共和党人Joel Kaplan担任首席全球事务官,还任命了特朗普的密友Dana White加入董事会。但我怀疑Meta再怎么做,也不会获得X那样在特朗普支持者心目中的地位。 所以我认为Meta的动作可能形式大于实质,主要是政治表态,实际内容生态未必发生很大变化。因为他再怎么折腾恐怕也很难获得特朗普支持者的好感,还不如维持原状争取除了X死忠用户以外的其他所有用户。另一方面,欧洲市场的规则目前依然照旧。 提及欧洲市场,X和欧洲市场的互动更加引人注意。由于马斯克对欧洲内政的干预,很多欧洲机构——包括但不限于政府、学术机构、新闻机构、慈善机构、医疗机构——正在撤离或者考虑撤离X,广告商更是早就撤离了。Meta也许数年内不会变更欧洲政策,这样有利于维持自己在欧洲的业务。这一系列事件也体现了尴尬的一点:欧洲没有自己的社交媒体平台。 有没有什么系统性的办法可以摆脱事实核查困境,而是转为避免呢?目前非常活跃的创作者平台们,比如抖音、Instagram、YouTube、Bilibili、小红书,他们并不依靠社交关系传播信息,而是订阅和推荐,形态更像数字电视台而非社交媒体。社交功能或者社区功能是这些视频平台的一部分附属功能,而非主体。数字电视台,不喜欢就换台,每个人都有自己喜欢的台,无论是算法推送还是主动订阅,都很容易走向这一点。纠纷自然就化解了很多,每个人都看自己相信的台,这是平台基础中的纠纷避免机制。这些平台,现在往往被称为“创作者”平台,平台上的作者称呼,也已经从influencer走向creators——就像中国Bilibili的“up主”——重点概念在创作者们向用户表达,而不是社交裂变传播。 但是,传统社交媒体例如X和微博,现在也是靠算法推送和主动关注来获取内容,这和创作者平台有什么区别呢?我认为,这些社交媒体的信息传播机制和创作者平台有很大区别。这类社交媒体拥有“转发”按钮,而这个按钮可能是对人性的巨大挑战。转发一条消息太容易了,很难有人能抵抗自己的惰性为每一次转发和评论去做事实核查。“病毒式传播”比喻精当。而在抖音、Instagram、YouTube、Bilibili、小红书这样的平台,人们是没有办法直接把一份内容转发到主要的时间线或推荐流上的,几乎不会有社交链条传播反应,这是传播形式的重大区别。 虽然我关注了博主,但在创作者平台关注和在传统社交媒体上关注,后续走向会不同。比如一个有影响力的视频博主,他要更新节目,不管是播客还是视频,需要考虑自己投入能否产生足够的收益,所以精心打磨制作,他的行为会围绕着他的作品。但在X上,博主行为是围绕热门议题的,可能一不小心就一个转发、评论就出去了,言论品质会下降很多。 这个转发按钮,让人类难以抵抗量身定制的信息投喂,一个个转发,把各种骇人听闻的定制消息裂变开来。这种裂变反应,也在破坏社交媒体的讨论氛围,令社交媒体自身价值下降。所以社交媒体应该有自我监管的动力。这里负面例子就是X,广告商流失太严重。但Meta业绩就挺好的,如前所述我觉得减少新闻与政治内容对Facebook业绩会有帮助,Meta的Threads也给新闻和政治内容降权;而X上到处都是耸人听闻的黄色新闻。 欧洲机构纷纷撤离X,可能不会有什么影响,就像早早离去的广告商,他们已经不需要通过X来触达用户群。YouTube与TikTok,和X已经不是一个体量的世界。 彩蛋 加州州长和 BBC针对加州山火做了一些事实核查工作。但我觉得加州州长本人作为参与方,一面之词可信度也有限,仅供参考。 最近,BBC也对Musk的推文做了事实核查。 知识共享许可协议 本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。
1
0
0
PakyuM
13天前
诈骗哪儿都有,中国美国你国我国咱国,区别是
如果你想,你能不能一枪把他崩了
那些在即刻上卖课割韭菜的大傻逼们
Rey_L: 我亲眼看见一个人开直播,另一边有一个下岗离异妈妈打电话过来,询问她现在下岗了,孩子要上学,跟你学习短视频真的可以一个月赚 5000 吗,他敢斩钉截铁地说,完全没有问题,然后那个宝妈就微信转账了 1999。 我后来问他,你真能把她交到一个月赚 5000吗,他说怎么可能,就她们这种人的智商,不被我割,也被别人割,我割还能割少一点,让她长长记性。 他们都有一套自洽的逻辑。而我们也会远远低估中国十亿的下沉地区,有多少没有保护意识的弱势群体,这不是一句周瑜打黄盖,愿打愿挨能够敷衍了事的。
22
1
1
PakyuM
13天前
为什么比即刻大多数人强多了?
不是已经 GDP 都不增长人口开始下降债务违约房价下跌失业暴涨无保障人群怨气随机释放了吗
怎么简中社会还是在慕强?强在哪儿?
萧墨: 大姐从百度离职之后,跟一澜,zoey一起创业成立了四百击,主攻产品经理培训。但那是在2021年,互联网职场培训的尾巴。尾巴到什么程度呢?黄有璨都因为完不成kpi,从三节课离职。 就这种环境之下,靠着三个女人的自媒体账号,四百击硬是招了几千个学生,培训他们当产品经理。但是这互联网市场,哪吃得下这么多产品经理啊? 当时我在四百击当运营老师,有幸tiktok在大范围招人,我教出来几十个海外游子,进了tiktok当内容运营。 后来我被排的课越来越少,直到讲师群变得死寂。我就知道这一天还是来了,四百击需要转型了。 最开始的四百击学群响,做付费社群,但是客群不对,交付也不好,持续了一年多就解散了。 大姐的账号沉寂了一段时间后,开始在抖音上直播,卖什么小绿瓶保健品,几百块钱一瓶。 如果只关注大姐,会觉得四百击是突然转型,但其实四百击在2022年就开电商带货的业务线了。是的,2021年成立的公司,2022年就布局了后手,商业嗅觉还是很强的。 但是这次转型依旧不顺利,能买几百块钱营养品的人,不在抖音,也不在大姐的直播间。对着十几个人的直播间,大姐支撑不下去,去筹备婚礼了。 婚礼又让大姐停播了几个月,再回来,开始转型做家具买手了,毕竟同济建筑系是实打实的。 如果只看大姐时间线,这是一个屡战屡败的创业故事。但是如果把故事视角拉远,放在这三个女人身上,确是一个非常励志的创业故事。 三个人一起创业,把死气沉沉的互联网培训业务做到细分市场第一名,然后布局电商带货,积累资源和势能。 关停培训业务之后,靠着带货业务,四百击在2023年做了三亿gmv。在2024年,大姐结婚了,一澜生了一对双胞胎,zoey也生了一个娃。 在市场的大风大浪之下,创业进入第五个年头,事业小成,有着一百多人的公司,姐妹还在身边,和爱的人结婚生子。 这比即刻上的大多数人,强太多太多了。
26
0
0