即刻App年轻人的同好社区
下载
App内打开

人工智能讨论组

人工智能or人工“智障”,一起聊聊人工智能新进展?

475445人已经加入

  • Deepthink
    2天前
    DeepSeek is hiring product managers~
    Please feel free to send your resume to zy.wu@deepseek.com
    03
  • Random_thoughts
    7天前
    年度最佳文章了,一直对由AI进行信息压缩和总结,提炼为经验有所怀疑。但是没想明白到底应该怎么做,我觉得这篇文章好像把各个观点打通了,到底要不要给模型 bias ,context 到底作用是什么,如何让AI摆脱中庸解

    为什么AI只会说正确的废话,以及怎么把它逼出舒适区

    211
  • 黄药师.如知笔记.AI简历姬
    1天前
    看到一篇帖子,先转来做成图存档
    00
  • 拔刀刘AI学习
    8天前
    豆包这价格你会买吗?🤔
    515
  • Max_means_best
    2天前
    三年多了,模型这边还是数据、infra越好,模型效果越好。
    期待新范式能改善一下。
    00
  • 童欧巴
    4天前
    近日 2026 红杉AI 大会上,Claude Code 之父 Boris Cherny 做了专题访谈和分享。

    总结下关键点:

    1、他个人的编程方式

    - 【100% 代码由 AI 编写】他每天通常会提交几十个 PR 请求,最高纪录为了测试极限,在一天内合并了 150 PR。
    - 【手机是主要的生产力工具】大部分编码工作,都是通过手机上的 Claude 应用程序完成。
    - 【智能体调度】他会同时开启多个会话,让成百上千个智能体在后台并行工作,结合 /loop 命令和 cron 定时任务,安排 AI 执行重复性工作(如:自动修复 CI,处理不稳定的测试代码,以及每 30 分钟抓取和聚类 X 上的用户反馈)。

    2、团队和公司的运作方式

    - 【全员写代码的跨学科通才团队】在 CC 团队中,不论角色是项目经理,产品经理,设计师,数据工程师还是财务人员,每个人都在使用 AI 写代码。
    - 【彻底告别手动编码】在 Anthropic 内部,所有地方都不再需要手动编写代码,包括所有的 SQL 查询,一切都由模型构建 ,不同员工的 Claude 智能体会通过 Slack 互相交流以解决未知问题。
    - 【坚持“吃狗粮”】他们在内部,完全使用准备对外发布的相同模型和工具,来构建自己的产品

    3、对未来的核心预测

    - 【编程问题已被“解决”】对于像 TypeScript React 等分布广泛的常见技术栈,AI 早就已经能够完美处理,甚至可以学习它从未见过的新框架。
    - 【软件开发的“印刷机”时刻】他将现在的 AI 编程比作 1400 年代发明的印刷机。未来软件构建将完全全民化,就像如今发短信和读写一样,成为所有人的基本技能。最适合编写会计软件的人,将是精通业务的会计师,而不是软件工程师,因为编程是简单的,难就难在领域知识。
    - 【初创公司的黄金时代】他预测未来 10 年,初创公司的数量将增加 10 。AI 让小团队能创造出与大公司同等的价值,并与大企业正面竞争,因为大企业转型迟缓且面临内部阻力。
    - 【SaaS 商业模式的改变】“转换成本”将不再成为企业的护城河(因为 AI 可以轻松将代码从一个平台移植到另一个),同时依赖复杂流程的模式也将被削弱(因为 AI 非常擅长理清和优化流程),但网络效应和规模经济等底层逻辑依然重要。
    - 【智能体编排的自动化】未来用户不再需要手动决定如何分配任务,或是否使用本地模型,模型会自动决定启动多少个子智能体,构建何种环境来完成任务。
    01
  • OrangeCLK
    3天前
    > 李小亮告诉财新,判决生效后,百度公司未履行,其近期已向江北新区法院申请强制执行,5月8日法院执行局工作人员电话告知他,即将立案。

    豆包减少免费服务有必要,再提供低质量的免费服务,会遇到很多类似问题。
    00
  • 童欧巴
    4天前
    近日 2026 红杉AI 大会上,Andrej Karpathy 做了专题访谈和分享。

    总结下关键点:

    1、软件 3.0 范式已来

    - 软件 1.0 是人类手写明确的代码规则,软件 2.0 是通过整理数据集来训练神经网络,软件 3.0 是将大语言模型视为解释器,你的提示词和上下文就是编程手段。
    - 在软件 3.0 时代,很多传统的应用架构和代码将不复存在,以前你需要编写复杂的管道,现在只需要把原始输入,比如一张图片交给模型,模型就能直接输出结果,神经网络将承担大部分的计算工作。
    - 未来,神经网络可能会变成计算机的主进程。

    2、从 Vibe Coding Agentic Engineering

    - 随着模型能力的跃升,人类越来越信任 AI 自动生成的代码块,不再逐行检查,而是跟着直觉和 AI 互动来写代码。这提高了能力的下限,让所有人都能轻松编程。
    - 智能体工程是 Vibe Coding 的专业化升级。专业的软件工程师不能因为用了 AI 就引入 Bug 或降低代码质量。
    - 智能体工程是一门关于“如何协调多个 AI 智能体,在不牺牲专业质量标准的前提下大幅提升开发速度”的工程学科。它极大地提高了能力的上限,让原本的 10 倍工程师变得更强。

    3、可验证性与参差不齐的智力

    - AI 在代码和数学等“可验证”领域的进步速度极其惊人,因为实验室可以通过强化学习(RL)环境自动验证对错,从而让模型飞速进化。
    - 最先进的模型可以瞬间重构 10万行代码,却可能会在日常逻辑中犯极度低级的错误(比如建议你走路去 50 米外的洗车店洗车)。这是因为现实生活中的很多情境缺乏高质量的强化学习数据。
    - Karpathy 提醒人们,LLM 本质上是带有强化学习外挂的“统计模拟电路”。它们没有内在动机、情绪或生命力。把它们当成“鬼魂”而非有感情的“动物”来看待,有助于更理性地使用它们。

    4、工程师角色的转变

    - AI 智能体拥有极好的记忆力,可以处理底层 API、张量维度、库之间的差异等繁杂细节,人类不再需要死记硬背这些。
    - 未来的工程师需要负责系统架构、美学、判断力、品味和监督。你需要向 AI 智能体提供极其详尽的规范文档,并确保整体设计的正确性和代码的最终质量。

    5、走向智能体原生的世界

    - 目前的互联网(UI、文档、URL)都是为人类阅读设计的。未来的基础设施将转变为“智能体原生”,互联网上的工具将变成 AI 的传感器和执行器,你可以直接用自然语言要求 AI 部署一个应用,而不需要人类去中间复制粘贴文档或配置 DNS。

    6、当智能变得廉价时,还有什么值得我们深入学习?

    Karpathy 引用了一句话:“你可以外包你的思考,但不能外包你的理解。”

    虽然 AI 可以帮你合成数据、编写维基百科、处理海量信息,但人类仍然是整个信息处理系统中的核心节点。

    你必须知道你要构建什么、为什么要构建,并深入理解事物,才能成为一个合格的导演去指挥你的 AI 智能体。
    01
  • OrangeCLK
    7天前
    这段时间试用Doubao 2.0 Lite medium 和DeepSeek 4 Pro high的API,感觉Doubao 2.0 Lite更好。更何况还有Doubao 2.0 Pro。但是豆包app完全没有体现出豆包的模型优势。

    2026年春节之后,我觉得国内很多免费AI聊天工具都退步了,虽然大家都发布了更强的新模型。但是在产能约束和需求暴增之下,继续免费提供服务那也只能降智。豆包非常明显,千问也不如三月份好了。时至今日,在豆包app里开专家模式,效果还没有调用Doubao 2.0 Lite API好,我自己体会是这样。

    如果是用豆包app的默认模式,那简直是胡说八道基本无法投入实用,错误百出。

    继续免费提供服务,豆包会面临两个结果:

    收不到钱
    用户觉得豆包笨
    可谓名利双失。但是如果改为付费,则名利双收。

    2026年春节以后,我觉得豆包和Kimi已经分化,豆包走向免费娱乐,而Kimi走向付费生产力。大概3月以后Kimi基本已经没法免费用,基本上要付费才能使用Kimi的基本功能。而付费之后,可以解锁Kimi的专业数据库、Office三件套、沙盒这些实用功能。都是上班利器。而且Kimi的预设还会让它很积极地写Python分析数据画图等等,对工作很友好。

    付费生产力这个生态位,在中国市场已经被Kimi占住。

    豆包有很多功能是不契合生产力付费这个场景的,比如视频通话、P图、语音问答。而豆包模型中生产力特别强的图像与视频功能,已经有了即梦这个付费生产力平台去承接。

    所以,现在豆包的产品形态和付费这个商业模式并不匹配。但是,我又觉得付费再怎么也比免费强,在现在token的供需关系下,免费实在没意义,一定是严重供不应求的,没法服务那么多用户。

    也有可能,在2028年算力供需紧张有所缓解之后,豆包再逐步放开免费权限,仍然回到免费娱乐的轨道上?

    豆包免费名利双失

    44
  • _W-A-Y_
    17:21
    一年多没有参加创赛,今年第一次报名进入复赛,正好帮我复盘一下项目
    00