即刻App年轻人的同好社区
下载
App内打开
canco-旁观者
1k关注559被关注0夸夸
前老鹅,自由投资者,懂点产品、投资的工程师,喜欢读书、研究公司八卦
canco-旁观者
6月前

广屿Ocean: AI时代会首轮淘汰【只依靠AI】写东西的人 MIT(麻省理工学院)最近研究了用户用AI写作的对大脑的影响,我觉得很值得我们普通人重视,如果直接说结论就是:实验证明用AI写作的人基本相当于不动脑了,等于把写作这件事完全外包给了AI —— 而这件事是非常非常非常危险的 这究竟是怎么回事呢?简单来讲就是,首先,完全依赖AI写作,大脑【认知思考】没有得到充分锻炼就会逐渐丧失能力;其次,即便AI写出了文章,但这篇文章其实压根就【不是你的】是你的身外物,你相当于只是一个信息的搬运工 实验有趣的地方是,有一个与纯粹依靠AI写作的对照组“Brain-to-LLM”,意思是,文章首先是写作者用自己的大脑去完成的,然后,对照组的作者再去使用LLM(大语言模型)重写旧文章,神奇的事情发生了,对照组的作者们“大脑网络连接性全频段飙升” MIT总结了三个可能的原因: 1,AI的反馈给作者提供了一种新的认知差异,使人重新思考当前的旧知识是否需要更新 2,它让人重新回忆已经写好的东西,重新从大脑提取出信息来再加工,这本身是一种强化记忆的训练过程 3,这个对话的过程会强迫我们启动元认知:AI为什么这样改?我当时为什么这么写? 你发现没有,当你脑子里面已经有成熟的思考和知识体系,再使用AI去优化,就相当于“和一位高尚的人对话”,而人类提升自身智识水平最传统的方式,不就是高质量的沟通吗? 写到这里,发现我之前反复推荐过的一篇文章含金量还在提升,是硅谷创业教父著名创投YC的创始人保罗·格雷厄姆在2024年底发表的一篇文章《写与不写》 文章的核心观点是,AI时代的首个人群分化将会把人分为“思考与不思考的人”,再进一步,思考与否是由“会写作的人”和“不会写作的人”决定的,而AI时代的聪明人,一定是会写作,会思考的人 为什么呢? 格雷厄姆认为写作是一项【艰难的技能】,它要求作者进行清晰的思考,而清晰思考本身就是一项复杂的任务,“许多人写作困难,根本原因在于这确实不易。要写得好,必须思路清晰,而清晰思考本就很难。” 在未来几十年内,随着AI技术的影响,越来越多的人将依赖AI进行写作,这将导致越来越少的人愿意学习写作技能,真正会写作的人将大幅减少 “我通常不愿预测技术的发展趋势,但对于这一点却颇有信心:几十年后,会写作的人可能不会太多。” AI技术的出现将创造一个“会写”和“不会写”的两大阵营,进而出现“思考”与“不思考”的分化世界,中间地带(即写作能力一般的人)将消失 “未来仍将有聪明人存在,但他们将是那些主动选择通过写作来锻炼与提升自己思考能力的人。换句话说,他们是主动选择成为聪明人的人。” 就像股神巴菲特老爷子有句名言:“你只能赚到你认知范围内的钱,凭运气得到的,最后都会靠实力亏回去。” 如果你把你的大脑教给AI,即便AI再强大,你也永远成为不了另一个“巴菲特”,你的认知都将是AI灌输给“所有人”的认知

00
canco-旁观者
7月前

阑夕ོ: 补完昨夜的Google I/O大会,感叹量大管饱的同时,还有一点暂时的想法: - 字节去年对于chatbot不是AI终极形态的反思是合理的,但看到问题和给出解法是两码事,目前来看,全栈式的服务体系是一个最优解,也就是瑞士军刀化,单独产品(场景)的含金量在下降; - OpenAI看到了这一点,所以Sam才一直强调ChatGPT的终身记忆,这有点类似当年的「网络效应」,不同的是,无法被迁移拿走的不再是关系链,而是AI对你的熟悉度; - 但是面对已经醒悟过来并全面反扑的Google,难度还是太大了,从这次「照例」拿来狙击Google的只有一个Codex就能看出,是真的弹尽粮绝了,压力都给到了GPT-5; - Google直接在经济价值最高的本土市场全量上了AI Mode,把搜索按钮都让了出来,对自己商业模式的大动脉开刀,实在是太狠了,全世界都会盯着它未来4个Q的财报,如果真能跑通,所有平台都要大变; - 就市场教育而言,羸弱的SaaS生态还在拖后腿,很难想象国产AI厂商能端出200美金/月的产品,打掉成本但又守不住价格的做法,用大家更熟悉的概念来定义,就是「卷」; - 可能真的不是移动互联网「用户本身就是商业模式」的逻辑,可能真的不是移动互联网「用户本身就是商业模式」的逻辑,可能真的不是移动互联网「用户本身就是商业模式」的逻辑,重要的事情说三遍; - 可灵2.0的跑分和用量还是领先的,但Veo 3会让快手腹背难安,今年是视频生成的大年,排在前面的那几张板凳是永远坐不热的; - 从时间表来看,DeepSeek-R2实际上已经跳票了,阿里通义的牌差不多打完了,字节Seed被期待能憋个大招出来,基础模型还有多少可被突破的断层,真实性越来越存疑; - 六小龙还不卖掉是在等着过清明节吗?

00
canco-旁观者
7月前

Neo张宁: Google I/O 发布会刷屏。 从模型到应用,从新产品发布到老产品升级,从技术预览到生产部署,全面开花。 为什么一个创办三十年之久、由职业经理人做 CEO、一年前被认为已落后于竞争的公司,能在这么短的时间里展现出如此爆发性的翻盘迹象? 以下是一些分析: 1/5 战略层面:果断重组,力出一孔。 面对挑战,Google最关键的举措之一是将旗下 AI 研究的两大核心团队 Google Brain 与 DeepMind 进行战略合并,成立统一的 Google DeepMind 部门。 组织上打破内部研究与产品之间的壁垒,整合顶尖人才与算力资源,形成统一的AI战略指挥中枢,极大地提升了从基础研究到产品快速迭代的效率。 不再是多头并进,而是集中火力攻坚。 2/5 内生动力:唤醒沉睡的巨人,激活核心资产。 Google 并非从零开始。 其数十年在人工智能领域(如 Transformer 架构的开创性贡献)的深厚积累、庞大的高质量数据集、世界领先的自研TPU计算集群(为 AI 模型训练与推理提供强大硬件支撑),以及覆盖全球数十亿用户的产品生态(Search, Android, YouTube, Workspace等,为 AI 技术提供了最佳的试验场与规模化部署渠道),这些都是其无可比拟的战略资产。 此轮爆发,正是这些沉睡资产被AI全面唤醒与激活的结果。 3/5 领导力与文化:自上而下的变革决心与紧迫感。 CEO Sundar Pichai 以“AI优先”为核心战略,展现了前所未有的决心与紧迫感,推动公司资源向AI领域全面倾斜。 更有联合创始人 Sergey Brin 亲自下场参与核心AI项目研发,并有报道称其在内部强调提高工作强度与效率以应对“AI 军备竞赛”。 这种自上而下的压力传递与以结果为导向的文化转变,是推动 Google 快速响应市场变化、提升执行力的关键。 大象仍能跳舞,即便由职业经理人领导。 4/5 策略调整:直面痛点,弥补短板。 此前,Google 在 AI 的产品化速度和用户体验方面,确实面临着增长的烦恼和外界的质疑。 本次 I/O 上,无论是 Gemini 系列模型(包括 Gemini 2.5 及 Deep Think)的重大能力升级,还是 AI Mode 在搜索引擎中的深度集成和美国用户的全面推广,以及 Gemini 在 Chrome 中的深度整合,都清晰地表明 Google 正有针对性地解决过往的不足,力求在关键应用场景上快速追赶并超越。 此外,新推出的 Veo 3 和 Imagen 4 等生成式媒体模型,以及 Android XR 眼镜的合作,也进一步展现了 Google 在 AI 产品化和用户体验提升上的决心。 5/5 外部环境:竞争压力下的绝地反击。 来自 OpenAI、微软等强劲对手在生成式 AI 领域的迅速崛起和商业化进展,无疑给 Google 带来了巨大的外部压力。这种前所未有的竞争态势,叠加全球范围内 AI 技术和应用的热潮,共同构成了强大的外部催化剂,迫使 Google 必须打破既有范式,以更快的速度、更大的决心投入到这场 AI 浪潮中,以捍卫其行业领导地位。 Google 此次展现的“翻盘”迹象是一个值得深入研究的企业案例。它是内部战略重塑、核心能力再聚焦、领导意志贯彻以及外部市场竞争共同驱动下的结果。 一个科技巨头一旦调整好航向,其积蓄的能量和爆发力依然令人瞩目。接下来的挑战在于,如何将这些技术和产品优势转化为持久的市场领先地位。

00
canco-旁观者
10月前

艾逗笔: 以 manus 为例,拆解以 multi-agent 为基础的通用任务智能体的工作流程: 一. 意图识别 1. 获取用户输入内容,进行必要的意图识别和关键词提取,比如用户输入的是“想去日本旅游,需要一个旅行计划”,拆解之后得到的关键词是: japan-trip,任务类型为:travel 2. 如果用户输入的需求比较简单,不能识别用户的意图,此步骤可以引导用户继续对话,补充更多的信息,或者上传文档 / 图片等资料 二. 任务初始化 1. 用识别出来的任务关键词创建任务文件夹,启动 docker 容器,为后续的任务执行做环境隔离 2. 任务执行过程中的内容产物,写入到任务文件夹,任务结束之后清理 docker 容器 三. 步骤规划 1. 使用意图识别的结果 + 补充背景信息,请求一个推理模型,对任务进行步骤拆分 2. 将任务拆分的步骤信息,写入到任务文件夹的 todo.md 四. 任务执行 1. 遍历任务文件夹中的 todo.md,[ ] 表示待执行的任务,[x] 表示已执行的任务 2. 取出待执行的任务,带上任务上下文信息,做一次 function call,这里带上的 function tools 是系统内置的可以执行不同任务的 agent,比如 search agent / code agent / data-analysis agent 3. 根据 function call 的结果,调度指定的 agent 执行任务,把执行过程中产生的内容,写入到容器中的任务文件夹 4. 任务执行完,由主线程,更新 todo.md,继续下一个任务 五. 归纳整理 1. todo.md 里面的任务全部执行完之后,主线程针对用户的初始需求,做一次整理输出 2. 把任务的内容产物,给到用户浏览或下载(文档 / 代码 / 图片 / 链接等) 3. 收集用户对任务的满意度 ---- 整个方案理下来,核心在于执行任务的 agent 设计,以及主线程的调度流程,以 search agent 为例,在处理“日本旅行计划”这个任务中,主要的执行步骤: 1. 拿到 japan-trip 等关键词信息,调用谷歌第三方 API,获取 10-20 条搜索结果 2. 模拟浏览器点开第一个网页,浏览网页内容,获取网页文本内容 + 浏览器截图拿到网页视觉信息 3. 调用支持多模态输入的模型,输入当前任务要求,从当前浏览的网页中提取有效信息(是否有符合要求的结果,如果不满足要求,返回下一个该点击的 button 元素) 4. 模拟浏览器点击 + 网页滚动行为,拿到更多的网页内容 + 视觉信息,重复几次,直到收集到的内容满足任务要求为止 5. 把收集到的内容保存到任务文件夹 这个 search agent 的核心在于模拟用户浏览网页行为,需要用到无头浏览器和多模态模型。 code agent 和 data-analysis agent 相对而言比较简单: 1. 根据任务需求,创建本地文件,写入代码(python 代码做数据分析,html 代码做视觉呈现) 2. 通过系统调用执行代码,把执行结果保存到任务文件夹 3. 通过 code-preview 服务,预览 html 文件的内容 --- 此类 multi-agent 产品,还有一些改进的空间: 1. todo.md 的多个任务,是线性依赖关系,可以使用 DAG(有向无环图)实现更加复杂的任务依赖 2. 需要引入自动化测试 agent,对任务结果进行判断和矫正,如果对某个步骤评分过低,需要回溯到之前的某个任务节点重新执行 3. 允许全自动 + 用户介入的混合模式,在某个步骤执行完,先寻求用户反馈,如果几秒内没收到反馈,则自动继续运行 --- 整体评价:manus 在工程层面做了很多工作,整体交互比其他产品好很多。技术层面,依然是没什么壁垒,对模型有比较深的依赖: 1. 也许有个小模型,做任务执行前的意图识别 2. 任务规划和推理,用 deepseek-r1 3. 图片识别 + 代码生成,用 claude-3.7-sonnet token 消耗会很高,能不能广泛用起来,取决于谁来负担这个成本。 最终的任务准确性和用户满意度,还需要更多的案例来说明。

00
canco-旁观者
10月前

阑夕ོ: Googl试探AI Mode——搜索结果完全没有10个蓝色超链接了,取而代之的是在对话里聚合答案——不算意外,意外的是目前Google是在把AI Mode当作增值功能专供给One AI Premium用户使用,这是一个20美金/月的订阅包。 我会条件反射的想到Neeva,2019年上线,2023年关闭,产品卖点是赌用户会为没有广告的搜索服务掏钱,预期值是6美金/月。 Neeva的创始人2003年入职Google,负责开发了核心广告产品Adwords,离职前已经升到了SVP,在Google声誉由盛转衰的节点出来做了订阅式搜索Neeva,赌的就是大家对于Google及其商业化的厌恶,会给主打质加比的平替服务提供机会。 Neeva也想剜掉展示10个蓝色超链接的体验,在前AI时代就尝试了很多信息重组的方法,甚至会堆人力去编辑热门关键词的反馈页面,但流量一直上不去,最后以融资估值的对价卖掉了。 创始人有解释过这次创业的种种痛苦,说很多人会以为花钱才能搜索的商业模式是失败原因,其实不然,说服用户为更好的体验付费一点都不难,转化率非常健康,问题主要出在没办法说服用户切换新的搜索引擎。 换句话说,Neeva不担心用户留存,但解决不了用户增长,俞军的著名公式——产品价值=(新体验-旧体验)-迁移成本——含金量还在发光,即便是从大厂出来、且深知大厂缺陷的人,也会低估用户对于熟悉环境的依赖性。 现在Google自己要来摘桃子了,我不怀疑AI Mode的测试数据只要够好,未来一定也能找到和广告融合的方法,并被推向大众市场,但就眼前的情况而言,Google是在亲自做一件所有号称Google杀手都想做的事情: 用户交一点钱,换取一个无广告、更简洁的搜索服务。 就很滑稽。

00