即刻App年轻人的同好社区
下载
App内打开

AI探索站

81612人已经加入

  • 阑夕ོ
    26天前
    这几天刷推很明显的感觉到英文技术社区对中国AI产业的进步速度处于一种半震动半懵逼的状态,应激来源主要是两个,一个是宇树(Unitree)的轮足式机器狗B2-W,另一个是开源MoE模型DeepSeek-V3。

    宇树在早年基本上属于是波士顿动力的跟班,产品形态完全照猫画虎,商业上瞄准的也是低配平替生态位,没有太大的吸引力,但从B系列型号开始,宇树的机器狗就在灵活性上可以和波士顿动力平起平坐了。

    B2-W的意外在于切换了技术线,用运动性更高但平衡性同时也更难的动轮方案取代了B2还在沿用四足方案,然后在一年时间里完成了能在户外环境里跋山涉水的训练,很多美国人在视频底下说这一定是CGI的画面,不知道是真串还是心态炸了。

    波士顿在机器狗身上也曾短暂用过动轮方案,或者说它测过的方案远比宇树要多——公司成立时长摆在那里——但是作为行业先驱,它连保持一家美国公司的实体都办不到了。

    现代汽车2020年以打折价从软银手里买了波士顿动力,正值软银账面巨亏需要回血,而软银当初又是在2017年从Google那里买到手的,Google为什么卖呢,因为觉得太烧钱了,亏不起。

    这理由就很离谱,美国的风险资本系统对于亏损的容忍度本来就是全球最高的,没有之一,对于前沿性的研究,砸钱画饼是再寻常不过了的——看这两年硅谷在AI上的投入产出比就知道了——但波士顿动力何以在独一档的地位上被当成不良资产卖来卖去?

    那头房间里的大象,美国的科技行业普遍都装作看不到:美国人,如今的美国人,从投行到企业,从CEO到程序员,从纽约到湾区,对制造业的厌弃已经成为本能了。

    A16Z的合伙人马克·安德森2011年在「华尔街日报」写了那篇流传甚广的代表作「软件吞噬世界」,大概意思是,边际成本极低的软件公司注定接管一切水草繁盛之地,和这种可以提供指数级增长的生意比起来,其他的行业都不够看。

    并不是说马克·安德森的表达有问题,后面这十几年来的现实走向,也确实在证明这条攫取规模化利润的回报是最高的,但美国人的路径依赖到最后必然带来一整代人丧失制造能力的结果。

    这里说的丧失制造能力,并不是说丧失制造兴趣或是热情,我前段时间拜访了深圳一家逆向海淘公司,业务就是把华强北的电子配件做成可索引的结构化目录,然后提供从采购到验货再到发包的全流程服务,最大的买方就是美国的DIY市场和高校学生,他们之所以要不远万里的等上几个星期委托中国人来买东西,就是因为在诺大的美国本土,根本找不到供应链。

    然后那些学生也只有在读书时才有真正尝试制造某些东西的机会,到了要去大公司里上班领薪后,再也没人愿意把手弄脏了。

    但软件终究不能脱离硬件运行,哪怕硬件生产的附加值再不够看,基于采集一手物理数据的入口,制造商腰板硬起来后去做全套解决方案,只取决于能不能组建好的工程师团队,反过来却不一样,制造订单长期外包出去,它就变成产业链配套回不来了。

    所以像是多旋翼无人机和四足机器狗这类新兴科技萌芽的原型机一般都还是产自有着试错资本的欧美,也就是所谓「从零到一」的过程,而在「从一到十」的落地阶段,中国的追赶成果就会开始密集呈现,进入「从十到百」的量产之后,中国的供应链成本直接杀死比赛。

    波士顿动力的机器人最早在网上爆火的时候,Google X的负责人在内部备忘录里说他已经和媒体沟通了,希望不要让视频和Google扯上太大关系,是不是很迷惑,这么牛逼的事情,你作为母公司非但不高兴,还想躲起来,现在你们懂得这种顾虑从何而来了,就是觉得贵为软件巨头的Google去卷袖子干制造的活儿太卑贱了呗。

    当然美国也还有马斯克这样的建设者(Builder),但你要知道马斯克的故事之所以动人,是因为他这样的人现在是极度稀缺的,而且长期以来不受主流科技业界待见,完全是靠逆常识的成就——造汽车,造火箭,造隧道,这都是硅谷唯恐避之不及的事情——去一步步打脸打出来的名声。

    如果说宇树是在硬件上引起了一波怀疑现实的热度,那么DeepSeek则在软件的原生地盘,把大模型厂商都给硬控住了。

    在微软、Meta、Google都在奔着10万卡集群去做大模型训练时,DeepSeek在2000个GPU上,花了不到600万美金和2个月的时间,就实现了对齐GPT-4o和Claude 3.5 Sonnet的测试结果。

    DeepSeek-V2在半年前就火过一波,但那会儿的叙事还相对符合旧版本的预期:中国AI公司推出了低成本的开源模型,想要成为行业里的价格屠夫,中国人就擅长做这种便宜耐用的东西,只要不去和顶级产品比较,能用是肯定的。

    但V3则完全不同了,它把成本降了10倍以上,同时质量却能比肩t1阵营,关键还是开源的,相关推文的评论区全是「中国人咋做到的?」

    虽然但是,后发的大模型可以通过知识蒸馏等手段实现性价比更高的训练——类似你学习牛顿三定律的速度降低的斜率也在有利于追赶者,肯定比牛顿本人琢磨出定律的速度要快——成本,但匪夷所思的效率提升,是很难用已知训练方法来归纳的,它一定是是在底层架构上做了不同于其他巨头的创新。

    另一个角度更有意思,如果针对中国的AI芯片禁售政策最后产生的后果,是让中国的大模型公司不得不在算力受限的约束下实现了效率更高的解决方案,这种适得其反的剧情就太讽刺了。

    DeepSeek的创始人梁文锋之前也说过,公司差的从来都不是钱,而是高端芯片被禁运。

    所以中国的大模型公司,像是字节和阿里这样的大厂,卡能管够,把年收入的1/10拿出来卷AI,问题不大,但初创公司没这么多弹药,保持不下牌桌的唯一方法就是玩命创新。

    李开复今年也一直在表达一个观点,中国做AI的优势从来不是在不设预算上限的情况下去做突破性研究,而是在好、快、便宜和可靠性之间找出最优解。

    零一和DeepSeek用的都是MoE(混合专家)模式,相当于是在事先准备的高质量数据集上去做特定训练,不能说在跑分上完全没有水分,但市场并不关心原理,只要质价比够看,就一定会有竞争力。

    当然DeepSeek不太一样的是,它不太缺卡,2021年就囤了1万张英伟达A100,那会儿ChatGPT还没影呢,和Meta为了元宇宙囤卡却阴差阳错的赶上AI浪潮很像,DeepSeek买那么多卡,是为了做量化交易⋯⋯

    我最早对梁文锋有印象,是「西蒙斯传」里有他写的序,西蒙斯是文艺复兴科技公司的创始人,用算法模型去做自动化投资的开创者,梁文锋当时管着600亿人民币的量化私募,写序属于顺理成章的给行业祖师爷致敬。

    交待这个背景,是想说,梁文锋的几家公司,从量化交易做到大模型开发,并不是一个金融转为科技的过程,而是数学技能在两个应用场景之间的切换,投资的目的是预测市场,大模型的原理也是预测Token。

    后来看过几次梁文锋的采访,对他的印象很好,非常清醒和聪明的一个人,我贴几段你们感受一下:

    「暗涌」:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?

    梁文锋:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

    「暗涌」:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。

    梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

    「暗涌」:但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。

    梁文锋:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

    「暗涌」:但做大模型,单纯的技术领先也很难形成绝对优势,你们赌的那个更大的东西是什么?

    梁文锋:我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

    「暗涌」:很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?

    梁文锋:V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

    「暗涌」:所以你对这件事也是乐观的?

    梁文锋:我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

    ⋯⋯

    是不是很牛逼?反正我是被圈粉了,做最难的事情,还要站着把钱赚了,一切信念都基于对真正价值的尊重和判断,这样的80后、90后越来越多的站上了主流舞台,让人非常宽慰,你可以说他们在过去是所谓的「小镇做题家」,但做题怎么了,参与世界未来的塑造,就是最有挑战性的题,喜欢解这样的题,才有乐趣啊。
    86324
  • 阑夕ོ
    1天前
    几年摸索下来,AI行业一直在不断推翻曾经的预判,很有意思。

    晚点对MiniMax创始人闫俊杰的那篇采访传得很广,主要的话题点在于闫抛了好几条非共识出来,比如模型能力和用户规模之间不存在飞轮,甚至如果用户太多,反而有可能分散公司的注意力,拖慢前言研发的效率。

    我刷到潘乱对此的评论有些不以为然,说要警惕这种180度大转弯的所谓反思,动辄否认行业积累下来的经验总和。与其觉得全世界都在开倒车,不如好好看清楚是不是自个在逆行。

    怎么说呢,我是觉得,「在自己生命的每个阶段都说了自己相信的东西」是每个人都不可避免的规律,不算特别难以理解,尤其是在一个格外年轻的行业,从业者都还是在满天的不确定性里找微弱的确定性。

    再举一个例子,不知道你们有没有注意到,例如新榜等越来越多的AI产品榜单,开始把夸克、WPS或是百度文库这样的所谓「非AI原生应用」列进去了,这在半年以前还是不太见得到的事情。

    也有越来越多的公司意识到,所谓的「AI原生应用」好像是个废话,就好比现在没有手机厂商会强调说新发布了一款触屏手机,出于对AI的敬畏和狂热,大家本来想等出一个iPhone时刻,等出一个漫威宇宙里的贾维斯出来,但在市场端,用户对于AI能力是否原生根本没有执念,他们只看有没有解决具体的问题。

    豆包PC端越来越像一个浏览器,百度新上的AI搜也在做集成,基本上都是夸克半年前就开始走的设计思路,突然间行业里全反应过来了,对话式问答不是标准答案,没必要为了AI而AI,在用户熟悉的场景里先建立使用并依赖AI的范式,才是见效最快的。

    夸克这款产品我之前提过很多次,现在虽然已经被捧成了「阿里之光」,但它押宝的路线图其实也被质疑过,在「AI取代搜索」和「AI改变搜索」之间,前者的想象空间和重新洗牌的刺激显然更大,而夸克赌的是后者,认为AI可以让搜索进化,能够「处理」而不是简单的「供给」信息,新能力和原入口可以一体化。

    后来发生的剧情都知道了,连ChatGPT都新增了联网搜索的按钮,很多苦于获客压力的同行也纷纷「打不过就加入」,形势永远比人强。

    七麦的2024年度统计,夸克累计下载3.7亿次,在AI产品里排在第一名,当然夸克也是做了大量的用户AI功能普及教育,但是如果没有千金散尽还复来的ROI,阿里又怎会为了夸克慷慨以赴。

    教育用户很必要,但优先级更高的前提是,尊重用户的需求。
    4070
  • GitHub充电宝
    4天前
    推荐一款可批量快速剪辑的Vlog神器:Klap。

    3 分钟即可帮助你剪辑一批网红短视频。能自动将冗长视频转化为吸睛短片!

    简直是自媒体人的必备神器

    地址:klap.app
    01:56
    274
  • orange.ai
    3天前
    今天不仅 TikTok 等一系列产品回归了,还多了一个新产品 😂

    字节发布了自家的 AI 编程工具,名字叫 Trae

    - 对标 Cursor ,适合新手入门的原生 AI IDE 工具
    - 内置模型 Claude 3.5 和 GPT-4o ,限时免费随便用
    - 中文友好,再也不怕 AI 说到一半变英语

    简单理解就是一个中文更好的,限时免费的 Cursor 或 Windsurf
    用它写了一个小插件测试了一下,交互流程基本和 Windsurf 相同
    有 Claude 3.5 底子在,效果应该也还行

    AI IDE Trae 的官网 trae.ai
    1933
  • 可厉儿
    2天前
    实测被豆包实时语音钓成翘嘴🍵
    04:09
    1786
  • Kenny_肯尼
    1天前
    小红书的AI翻译为什么这么快? 因为提前翻译做了缓存。如何推导实现逻辑:

    1. 大模型的速度基本是一个字一个字吐出来,不可能一点翻译,立马展示翻译。所以判断,肯定是提前做了翻译缓存

    2. 如何验证上述猜想?反复点击翻译,你会发现每次的结果都一样,否则每次点击调用大模型,结果会不一样。

    3. 那应该什么时候把评论送翻呢,会不会存在还没翻译完,其他用户就点击翻译评论? 一个合规知识,你在互联网上看到的所有内容其实都经过审核,评论更不例外。用户写了评论,送去机器审核,同时拿去翻译,等审核通过后,大概率翻译结果也返回了,所以用户看到评论原文时,译文几乎也都同时存在了
    3012
  • 歸藏
    2天前
    字节发布了一个新的 AI 代码 IDE 产品 Trae

    受邀测试了一下功能挺强大的,更像 Windsurf 和 Cursor 的结合体,两个软件的亮点都有

    - 非常详细的启动引导,很适合新手
    - 目前限时免费,用的 Claude 3.5
    - Builder 模式可以自动分解和执行任务
    - 支持上传图片跟模型沟通,支持通过#引用指定文件
    - 有一个内建的预览网页,不需要每次都开网页调试

    写了个小项目,一次就成,挺好的,体验上比那两家好太多了,做产品细节这块,还得看字节

    产品官网:trae.ai
    00:48
    1537
  • yusen
    2天前
    刚过去的这个周末有点让人头昏目眩,但或许只是向未来世界的惊鸿一瞥。

    “If you value intelligence above all other human qualities, you’re gonna have a bad time.” —— Ilya Sutskever

    周末读了一本好书:《第一只眼》。作者提出了解释寒武纪大爆发的「光开关」理论。在寒武纪之前地球生命经历了 20多亿年的缓慢进化,也不过是原始海洋中的鼻涕虫。然而在某个命运攸关的时刻,原始三叶虫外壳上出现了一个对光线敏感的点,这个点迅速带来了巨大的生存优势,在一百万年里便进化成第一只眼睛,从此地球不再是田园童话,生命间出现了主动积极的捕食行为和防御行为,捕食者和猎物都开始了红皇后对爱丽丝所说的赛跑:「你必须全力奔跑,才能留在原地」,从而展开了一场持续数亿年的伟大演化史诗。

    地球上的智能历经五次突破后,终于来到了决定性的时刻——创造超越自己的智能。年初和一些前沿 AI 研究员聊完,在 AI 让人瞠目结舌的进展速度前,大家在过去的一年里或多或少都变成了降临派,实现 AGI 已经不是「能不能」,而是「会在202X 年实现」的问题。然而人类如何与超级智能共处,终极的技术是否会最终带来终极的不平等呢?

    “The Times 03/Jan/2009 Chancellor on brink of second bailout for banks. —— Satoshi Nakamoto

    技术往往始于热爱好奇与普惠,没于权力贪婪与垄断。从无人知晓是谁的中本聪发明比特币和区块链开创去中心化愿景开始,十余年时间世界就走到了美国总统携全家发币搞钱的境地。

    “Across the great wall, we can reach every corner in the world. —— Wang Yuen Fung

    互联网世界的第一批原住民曾经也真诚相信技术能够让信息跨越重洋,填平鸿沟,让普通人看到更大的世界,勇敢的少年也可能创造奇迹。正因为黄金时代的记忆尚且栩栩如生,当看到转瞬之间已是高墙林立和信息茧房的时候才更觉得痛心。
    58
  • 栗噔噔
    2天前
    体验了一把字节出品的AI编程工具Trae
    半小时体验完全流程做了个web工具
    再半小时写完了文章,一抬头凌晨4点多了

    对喜欢的事永远不会累🥰
    107
  • 马丁的面包屑
    2天前
    HI,朋友,飞书2ALL感兴趣吗?
    支持公众号、小红书图文、知乎、稀土掘金、人人都是产品经理
    还支持一键发布(直接帮你贴进各个平台的编辑后台)
    各位嘉宾可以看VCR,确认下对不对眼~
    内测群看评论区置顶哈
    whjlnspmd6.feishu.cn
    02:16
    197