小猴冲冲的个人主页

即刻App年轻人的同好社区

下载

App内打开

小猴冲冲

326关注1k被关注0夸夸

以古典之心，行AI之事

小猴冲冲

28天前

曾经以为日均烧一亿token很遥远

4 20

小猴冲冲

6月前

工程师耗费数年把商品检索时间由0.8s缩为0.5s，结果来了一位AI产品，把检索框换成了对话框，让用户先看10s的深度思考，5s的工具调用，最后推几个普通的商品，还要再花3s说明推荐理由。

算法耗时数年优化目的地推荐，成功把目的地推荐的准确率提升到了80%，让用户无需输入即可叫车，结果来了一位AI产品，把推荐词换成了助手入口，让用户输入内容由目的地变为一句话，模型傻乎乎的分析了半天给出了三个不知道怎么选的选项。

古典产品致力于别让用户想，别让用户等。
一些AI产品偏要让用户想，让用户等。

18 00

小猴冲冲

8月前

Claude断供后最大的惊喜是发现K2近乎能平替4 Sonnet在Multi-Agent调度任务上的表现，而且速度更快，而GPT5却常常偷懒漏调用工具（尤其单轮工具＞3的情况）。#再见Claude

8 20

小猴冲冲

10月前

如果一个问题的解决方案太复杂，很可能是解决方案错了，更可能是要解决的问题错了（回顾一个20个节点的LLM Workflow有感）

3 00

小猴冲冲

1年前

A2A的出现看起来解决了一些Agent协同的通信问题及过程显示问题，任务状态管理、流式输出/推送机制、上下文交换、多类型输出，解决了很多工程上的问题，虽然可能模型的问题还存在，但预感未来结合更好的动态规划执行模型和MCP生态，Multi-Agent会变得越来越可落地

小猴冲冲: 纯自主规划的 Multi-Agent在生产环节的落地还是太难了，一会儿漏掉工具，一会儿搞错顺序，一会儿重复说话，更别提LLM as Tool的时延和产品化解析的复杂度了。感觉有调框架和模型的功夫，早都搭出来稳定能并行节点的DAG Workflow了… 人类总是希望纯粹的智能，但又以“做事流程是否符合自己预期”为评判标准，在现阶段还是太矛盾了。

4 00

小猴冲冲

1年前

又一起，再次提醒吧，不管是规则还是端到端，现在的智驾issues就和大模型幻觉一样，是解不完的

小猴冲冲: 在自动驾驶公司待了两年后，反而对自动驾驶更绝望和谨慎。每天看到路测车辆新增的数千个issues，解不完的corner cases，心里想的都是“这TM可是L4级的车辆和特定的安全路段，全球也就近千台车每天都能报这么多问题，那些L2＋的车企是怎么敢以那么普信的口吻宣传智驾全场景覆盖？那些用户是怎么敢开着L2＋的车在高速上睡觉的？”

1 01

小猴冲冲

1年前

写prompt最快乐的时刻就是删减和格式化，这何尝不是新时代的诗呢

4 31

小猴冲冲

1年前

纯自主规划的 Multi-Agent在生产环节的落地还是太难了，一会儿漏掉工具，一会儿搞错顺序，一会儿重复说话，更别提LLM as Tool的时延和产品化解析的复杂度了。感觉有调框架和模型的功夫，早都搭出来稳定能并行节点的DAG Workflow了…

人类总是希望纯粹的智能，但又以“做事流程是否符合自己预期”为评判标准，在现阶段还是太矛盾了。

4 32

小猴冲冲

1年前

大厂很多AI项目的分工还没有跟上时代，还是产品写PRD和流程图->技术评审->技术出方案写Prompt搭Workflow，但实际上产品可以直接跳到最后一步。

引入了工程团队的项目，往往会执迷于自己接入API自建一套工作流平台，最终发现是重复造轮子。

引入了算法团队的项目，往往会执迷于做Pre-Train和SFT，对提示词工程和流程编排的琢磨并不会投入大量时间（可能是因为无法体验算法价值），这其实是产品的机会。

最近才发现没有几个团队是由产品搞定这些事的，如果大家想做一样的事情，欢迎加入我们～（突然广告，JD参考上个贴）。

16 34

小猴冲冲

1年前

很遗憾看到Alexandr Wang和Dario Amodei面对竞争的第一反应是号召国家封锁，想到这两年还看过一些吹这两个人的播客，播客中的他们一个是MIT天才辍学创业少年，一个是屠龙勇士，现在才发现格局就只有这么点。

准备尝试把新财年的API预算由Sonnet换为V3&R1了，即使可能需要一些时间来解决模型自我意识太强的问题。

11 20