即刻App年轻人的同好社区
下载
App内打开
axiudoudou
7关注1被关注0夸夸
🔫 每天三分钟正义感
axiudoudou
1月前
拍到一只过马路的小狗
10
axiudoudou
2月前
看电影看电视的时候玩手机更香
00
axiudoudou
3月前
一段时间内的大招,ai infra + rl

https://b23.tv/jWe0Tfq

10
axiudoudou
3月前
挺喜欢看门外汉一本正经的解读,活在自己的自洽的逻辑里面,这种视角也很重要

于冬琪: 看到DeepSeek团队最新的论文,才理解DeepSeek为什么强大。 因为DeepSeek可能找到了一条AI进化的坐标轴。 只要自己不断沿着坐标轴前进,就能实现不断的成功。 有个意外的发现。 豆包过去几个月,又拿回了AI应用日活第一的位置。 然而,我最近问了不少内容人,我如果要用AI辅助长文写作,哪个AI工具会更好?内容人们最经常给出的答案是: 首选Claude、其次GPT,国产模型则首推DeepSeek。 绝不能用豆包。 为什么会这样呢? 我自己直观的感受是:长文写作,更需要保障对信息输入的高质量理解、和逻辑能力。这两点正好是DeepSeek的特长。 回想我第一次用到DeepSeek时,惊艳到我的,估计和经验到很多人的点类似,是DeepSeek的“深度思考”。 此前用AI产品,一直困扰我的问题是,AI有幻觉,我不知道结果能不能信,也就不能放心使用。但是,当DeepSeek展示出模型的思考逻辑后,不仅这个逻辑对人会有启发,更让我有了检查模型结果的方式,容易检查、就使得模型有了更可被相信的基础。 展示逻辑,是AI对话体验上的突破。 DeepSeek也靠着推理模块的加入,实现了更强的逻辑和信息理解能力。 这是技术创新的力量。 不过,我此前一直也有个朴素的观点: 科技创新是偶然的,一个企业可能有一次选对了技术路线、实现了突破。 但是,谁都不能保证其他技术路线的判断上,他也能赌对。 对于一个规模不大的公司来说,技术突破注定是需要看运气的、偶然才能出现的现象。 直到这几天,看到了DeepSeek团队发布的新论文,和对这个新论文的解读,我才意识到,有可能DeepSeek还真能实现持续不断的突破,因为他们很可能是找到了一个AI进化的坐标轴。 他们在最新的论文中,为大模型增加了一个新的要素——“概念”。 什么意思呢? 最早的大模型,其实是在基于语言的上下文,不断推演下一个字应该是什么。 这个时候,比如“英国女王伊丽莎白”,在人类的理解中,是一个完整的概念,我们因为知道这个概念,直接调用就好,但是在大模型眼中,这8个字需要被重新产出一遍。 对人类大量概念的一遍遍重新理解和推演,极大的浪费了大模型的能量和效率,也难免使得大模型的产出更容易出问题。 于是,DeepSeek决定为大模型建立一个概念库:在库里面的概念,可以作为整体,直接被调用。 我忽然发现, 这个概念的引入,与25年初,DeepSeek在大模型中,引入了“逻辑推理”模块,本质上是同一个思路。 此前的大模型,更像是对人类对话的暴力破解——ChatGPT证明了只要算力够大、数据量够大,人类的对话是可以被暴力破解的。 如果我们将在一次对话中找到高质量回答的过程,类比于走迷宫,那么此前的暴力破解大模型,解题的思路是:我只要能穷尽所有可能性,总能找到对的路。 随着走迷宫经验增加,大模型也能学习出一些走迷宫的套路,效率也能渐渐提升。 但是, 其实从来就不必尝试所有的道路的。 这些走迷宫的套路,也无需大模型自己慢慢摸索。 在人类的思考中,其实早就有一些规则,能够直接告诉我们“哪些路肯定不靠谱、根本不用考虑,只有几个大概率正确的方向,只需要尝试这几个方向”。 “逻辑推理”和“建立概念”,就是排除错误方向、使得模型可以效率更高、也可以走得更远的工具。 而这两个工具、或者说概念的发现,是来自于对人脑理解世界、思考问题过程的还原和研究。 人脑有一个独特的优势: 人脑每秒钟接触到的信息是10G,但是,人脑会识别和保留的只有其中的10bit。 因为需要长期储存和处理的信息量被大大简化,人脑的能量消耗才得以大大降低、很多关联起更多概念和维度的深度思考也才能变为现实。 可以说: DeepSeek团队,是在拆解人脑的思考和理解世界的过程,将其中有价值的工具和模式,赋予大模型。 如果这条路是成立的,那么DeepSeek就找到了一个支持继续持续迭代的坐标轴,就很有可能实现持续不断的技术突破。 每一个不断实现技术突破的企业,在那段时间,都找到了自己的坐标轴。 比如: 苹果,找到的坐标轴,是让交互更符合人的直觉,用更接近自然动作的交互方式、替代需要学习的更机械的交互方式。 因此,苹果从鼠标、到iPhone、再到VR,推出了一代代划时代的产品。 华为,找到的坐标轴,是让通信频率更高、能够有更大的带宽传输信息,过程中主要面临的难题,就是信号干扰带来的数学问题。 因此,从3G、到4G再到5G。 这个坐标轴,成为了驱动DeepSeek前进的主要方向。 对比之下,豆包更多时间是在追求数据。 当然,在堆积数据量的逻辑里,豆包也在讲一个故事:如果有更多的人使用豆包,豆包拥有的数据量更大,更大数据量会带来更强的服务能力。 这个故事,乍一看符合逻辑。 因此,豆包在很长时间里,一直有着行业最高的投放预算。 靠着大投放预算,豆包实现了最高的下载、和很长时间里最高的日活。 可是,这些日活和数据,真的能够转化成服务能力吗? 未必。 因为最容易获取的、最容易留住的,很多是那些要求更低的用户。 我没有统计数据, 不过,在体感中,我会遇到很多下沉市场的用户更爱用豆包。 残酷的说,服务他们、留住他们,比起服务那些更需要AI完成复杂任务的白领,是更简单的。 我也会遇到很多小朋友爱用豆包, 因为豆包会不断的称赞他们、捧臭脚。 很多小朋友就被夸夸得无法自拔。 但是,更有自主意识的人,反而会因此反感豆包,觉得“豆包总在试图讨好我”。 低要求的用户,总是更容易获取、也更容易满足的。 但是,低要求的用户,不会驱动产品,形成能满足复杂需求的能力。 这是追求数据增长,常常会掉进去的坑。 对比之下,DeepSeek的团队,主要驱动力则不是数据。 更像是大家有一个共同的信仰:让AGI变成现实。 基于此,团队找到了一个前进的方向:从人脑的思考、理解世界的模式中,寻找宝藏,嫁接到AI上。 他们精力有限,因此将主要的精力,几乎全部投向了这个方向。 于是, 当豆包在加功能时,DeepSeek在研究新技术。 当豆包看到自己不再是日活和下载量第一时,豆包会努力做增长。 当DeepSeek不再是日活和下载量第一时,DeepSeek好像对此毫不在意,还是在研究新技术。 像这次DeepSeek发布的论文, 在我的观感中,为大模型增加“概念”,在使用时的感受,远不像增加“逻辑”那么强烈。 这个更新,并不足以让DeepSeek重新拿回日活第一的位置。 但是,我相信DeepSeek并不在乎。 在他们眼中,改进技术、提高大模型的理解能力和数据处理能力,是更重要的事儿。 实话说,在这一轮的大模型竞赛中,我也不知道最终谁会胜出。 但是,如果有最终的胜利者。 比起豆包,情感上,我会更希望胜利者是DeepSeek。

00
axiudoudou
3月前
今年车厘子真便宜
00
axiudoudou
4月前
好久没登录QQ了,这个现在是什么群体在用呢
00
axiudoudou
4月前
刚才xhs刷到卖张小龙的饭否动态合集,搜了下app store,居然有新的第三方客户端了,但是我想不起来账号密码了可恶
哈哈哈,话说这个开饭app作者居然是我粉丝,一直用的我的动态页当截图
00
axiudoudou
4月前
有点后悔入手17 Pro,体验实在拉胯。铝合金机身手感偏软,质感完全不够高级;才用了一周,拍照键就磕出了小坑,电源键不仅按着手感发绵,还隐约有不回弹的情况。早知道当初该选17 Air,esim对我来说根本不算缺点。
00