axiudoudou的个人主页

即刻App年轻人的同好社区

下载

App内打开

axiudoudou

7关注1被关注0夸夸

🔫 每天三分钟正义感

axiudoudou

1月前

拍到一只过马路的小狗

0 10

axiudoudou

2月前

看电影看电视的时候玩手机更香

0 00

axiudoudou

3月前

一段时间内的大招，ai infra + rl

https://b23.tv/jWe0Tfq

0 10

axiudoudou

3月前

玉伯: 有次跟文兄聊，谈到一个话题：创始人的权力来自哪。看历史长河，皇帝的权力，来自轻松一句话可灭你九族。黑社会老大，权力也来自武力。回到创业公司。创始人的权力，起初来自融钱，起步后来自赚钱，中后期来自分钱。如果字节没有钱，没有人会跟随张一鸣。如果 Manus 的 ARR 是个位数，真格大概率就不愿再去欣赏蝴蝶扇翅膀。诚实看世界，世界很诚实。

0 00

axiudoudou

3月前

挺喜欢看门外汉一本正经的解读，活在自己的自洽的逻辑里面，这种视角也很重要

于冬琪: 看到DeepSeek团队最新的论文，才理解DeepSeek为什么强大。因为DeepSeek可能找到了一条AI进化的坐标轴。只要自己不断沿着坐标轴前进，就能实现不断的成功。有个意外的发现。豆包过去几个月，又拿回了AI应用日活第一的位置。然而，我最近问了不少内容人，我如果要用AI辅助长文写作，哪个AI工具会更好？内容人们最经常给出的答案是：首选Claude、其次GPT，国产模型则首推DeepSeek。绝不能用豆包。为什么会这样呢？我自己直观的感受是：长文写作，更需要保障对信息输入的高质量理解、和逻辑能力。这两点正好是DeepSeek的特长。回想我第一次用到DeepSeek时，惊艳到我的，估计和经验到很多人的点类似，是DeepSeek的“深度思考”。此前用AI产品，一直困扰我的问题是，AI有幻觉，我不知道结果能不能信，也就不能放心使用。但是，当DeepSeek展示出模型的思考逻辑后，不仅这个逻辑对人会有启发，更让我有了检查模型结果的方式，容易检查、就使得模型有了更可被相信的基础。展示逻辑，是AI对话体验上的突破。 DeepSeek也靠着推理模块的加入，实现了更强的逻辑和信息理解能力。这是技术创新的力量。不过，我此前一直也有个朴素的观点：科技创新是偶然的，一个企业可能有一次选对了技术路线、实现了突破。但是，谁都不能保证其他技术路线的判断上，他也能赌对。对于一个规模不大的公司来说，技术突破注定是需要看运气的、偶然才能出现的现象。直到这几天，看到了DeepSeek团队发布的新论文，和对这个新论文的解读，我才意识到，有可能DeepSeek还真能实现持续不断的突破，因为他们很可能是找到了一个AI进化的坐标轴。他们在最新的论文中，为大模型增加了一个新的要素——“概念”。什么意思呢？最早的大模型，其实是在基于语言的上下文，不断推演下一个字应该是什么。这个时候，比如“英国女王伊丽莎白”，在人类的理解中，是一个完整的概念，我们因为知道这个概念，直接调用就好，但是在大模型眼中，这8个字需要被重新产出一遍。对人类大量概念的一遍遍重新理解和推演，极大的浪费了大模型的能量和效率，也难免使得大模型的产出更容易出问题。于是，DeepSeek决定为大模型建立一个概念库：在库里面的概念，可以作为整体，直接被调用。我忽然发现，这个概念的引入，与25年初，DeepSeek在大模型中，引入了“逻辑推理”模块，本质上是同一个思路。此前的大模型，更像是对人类对话的暴力破解——ChatGPT证明了只要算力够大、数据量够大，人类的对话是可以被暴力破解的。如果我们将在一次对话中找到高质量回答的过程，类比于走迷宫，那么此前的暴力破解大模型，解题的思路是：我只要能穷尽所有可能性，总能找到对的路。随着走迷宫经验增加，大模型也能学习出一些走迷宫的套路，效率也能渐渐提升。但是，其实从来就不必尝试所有的道路的。这些走迷宫的套路，也无需大模型自己慢慢摸索。在人类的思考中，其实早就有一些规则，能够直接告诉我们“哪些路肯定不靠谱、根本不用考虑，只有几个大概率正确的方向，只需要尝试这几个方向”。 “逻辑推理”和“建立概念”，就是排除错误方向、使得模型可以效率更高、也可以走得更远的工具。而这两个工具、或者说概念的发现，是来自于对人脑理解世界、思考问题过程的还原和研究。人脑有一个独特的优势：人脑每秒钟接触到的信息是10G，但是，人脑会识别和保留的只有其中的10bit。因为需要长期储存和处理的信息量被大大简化，人脑的能量消耗才得以大大降低、很多关联起更多概念和维度的深度思考也才能变为现实。可以说： DeepSeek团队，是在拆解人脑的思考和理解世界的过程，将其中有价值的工具和模式，赋予大模型。如果这条路是成立的，那么DeepSeek就找到了一个支持继续持续迭代的坐标轴，就很有可能实现持续不断的技术突破。每一个不断实现技术突破的企业，在那段时间，都找到了自己的坐标轴。比如：苹果，找到的坐标轴，是让交互更符合人的直觉，用更接近自然动作的交互方式、替代需要学习的更机械的交互方式。因此，苹果从鼠标、到iPhone、再到VR，推出了一代代划时代的产品。华为，找到的坐标轴，是让通信频率更高、能够有更大的带宽传输信息，过程中主要面临的难题，就是信号干扰带来的数学问题。因此，从3G、到4G再到5G。这个坐标轴，成为了驱动DeepSeek前进的主要方向。对比之下，豆包更多时间是在追求数据。当然，在堆积数据量的逻辑里，豆包也在讲一个故事：如果有更多的人使用豆包，豆包拥有的数据量更大，更大数据量会带来更强的服务能力。这个故事，乍一看符合逻辑。因此，豆包在很长时间里，一直有着行业最高的投放预算。靠着大投放预算，豆包实现了最高的下载、和很长时间里最高的日活。可是，这些日活和数据，真的能够转化成服务能力吗？未必。因为最容易获取的、最容易留住的，很多是那些要求更低的用户。我没有统计数据，不过，在体感中，我会遇到很多下沉市场的用户更爱用豆包。残酷的说，服务他们、留住他们，比起服务那些更需要AI完成复杂任务的白领，是更简单的。我也会遇到很多小朋友爱用豆包，因为豆包会不断的称赞他们、捧臭脚。很多小朋友就被夸夸得无法自拔。但是，更有自主意识的人，反而会因此反感豆包，觉得“豆包总在试图讨好我”。低要求的用户，总是更容易获取、也更容易满足的。但是，低要求的用户，不会驱动产品，形成能满足复杂需求的能力。这是追求数据增长，常常会掉进去的坑。对比之下，DeepSeek的团队，主要驱动力则不是数据。更像是大家有一个共同的信仰：让AGI变成现实。基于此，团队找到了一个前进的方向：从人脑的思考、理解世界的模式中，寻找宝藏，嫁接到AI上。他们精力有限，因此将主要的精力，几乎全部投向了这个方向。于是，当豆包在加功能时，DeepSeek在研究新技术。当豆包看到自己不再是日活和下载量第一时，豆包会努力做增长。当DeepSeek不再是日活和下载量第一时，DeepSeek好像对此毫不在意，还是在研究新技术。像这次DeepSeek发布的论文，在我的观感中，为大模型增加“概念”，在使用时的感受，远不像增加“逻辑”那么强烈。这个更新，并不足以让DeepSeek重新拿回日活第一的位置。但是，我相信DeepSeek并不在乎。在他们眼中，改进技术、提高大模型的理解能力和数据处理能力，是更重要的事儿。实话说，在这一轮的大模型竞赛中，我也不知道最终谁会胜出。但是，如果有最终的胜利者。比起豆包，情感上，我会更希望胜利者是DeepSeek。

1 00

axiudoudou

3月前

今年车厘子真便宜

2 00

axiudoudou

4月前

好久没登录QQ了，这个现在是什么群体在用呢

0 00

axiudoudou

4月前

刚才xhs刷到卖张小龙的饭否动态合集，搜了下app store，居然有新的第三方客户端了，但是我想不起来账号密码了可恶
哈哈哈，话说这个开饭app作者居然是我粉丝，一直用的我的动态页当截图

6 00

axiudoudou

4月前

有点后悔入手17 Pro，体验实在拉胯。铝合金机身手感偏软，质感完全不够高级；才用了一周，拍照键就磕出了小坑，电源键不仅按着手感发绵，还隐约有不回弹的情况。早知道当初该选17 Air，esim对我来说根本不算缺点。

2 00

axiudoudou

4月前

防抑郁办李主任: 没什么好规划的，人生真的没什么好规划的。车灯只能照亮50米，可是车子就是可以开完全程。

1 00