即刻App年轻人的同好社区
下载
App内打开
小猴冲冲
322关注1k被关注0夸夸
以古典之心,行AI之事
小猴冲冲
28天前
昨晚突发奇想把小红书当即刻发,没想到流量还不错hh,昨晚创建的新号,欢迎各位盆友关注🤣

即刻还是会经常更新的!!!先即再🍠,玩一玩~
90
小猴冲冲
1月前
工程师耗费数年把商品检索时间由0.8s缩为0.5s,结果来了一位AI产品,把检索框换成了对话框,让用户先看10s的深度思考,5s的工具调用,最后推几个普通的商品,还要再花3s说明推荐理由。

算法耗时数年优化目的地推荐,成功把目的地推荐的准确率提升到了80%,让用户无需输入即可叫车,结果来了一位AI产品,把推荐词换成了助手入口,让用户输入内容由目的地变为一句话,模型傻乎乎的分析了半天给出了三个不知道怎么选的选项。

古典产品致力于别让用户想,别让用户等。
一些AI产品偏要让用户想,让用户等。
00
小猴冲冲
3月前
Claude断供后最大的惊喜是发现K2近乎能平替4 Sonnet在Multi-Agent调度任务上的表现,而且速度更快,而GPT5却常常偷懒漏调用工具(尤其单轮工具>3的情况)。#再见Claude
20
小猴冲冲
5月前
如果一个问题的解决方案太复杂,很可能是解决方案错了,更可能是要解决的问题错了(回顾一个20个节点的LLM Workflow有感)
00
小猴冲冲
8月前
A2A的出现看起来解决了一些Agent协同的通信问题及过程显示问题,任务状态管理、流式输出/推送机制、上下文交换、多类型输出,解决了很多工程上的问题,虽然可能模型的问题还存在,但预感未来结合更好的动态规划执行模型和MCP生态,Multi-Agent会变得越来越可落地

小猴冲冲: 纯自主规划的 Multi-Agent在生产环节的落地还是太难了,一会儿漏掉工具,一会儿搞错顺序,一会儿重复说话,更别提LLM as Tool的时延和产品化解析的复杂度了。感觉有调框架和模型的功夫,早都搭出来稳定能并行节点的DAG Workflow了… 人类总是希望纯粹的智能,但又以“做事流程是否符合自己预期”为评判标准,在现阶段还是太矛盾了。

00
小猴冲冲
9月前
写prompt最快乐的时刻就是删减和格式化,这何尝不是新时代的诗呢
31
小猴冲冲
9月前
纯自主规划的 Multi-Agent在生产环节的落地还是太难了,一会儿漏掉工具,一会儿搞错顺序,一会儿重复说话,更别提LLM as Tool的时延和产品化解析的复杂度了。感觉有调框架和模型的功夫,早都搭出来稳定能并行节点的DAG Workflow了…

人类总是希望纯粹的智能,但又以“做事流程是否符合自己预期”为评判标准,在现阶段还是太矛盾了。
32
小猴冲冲
10月前
大厂很多AI项目的分工还没有跟上时代,还是产品写PRD和流程图->技术评审->技术出方案写Prompt搭Workflow,但实际上产品可以直接跳到最后一步。

引入了工程团队的项目,往往会执迷于自己接入API自建一套工作流平台,最终发现是重复造轮子。

引入了算法团队的项目,往往会执迷于做Pre-Train和SFT,对提示词工程和流程编排的琢磨并不会投入大量时间(可能是因为无法体验算法价值),这其实是产品的机会。

最近才发现没有几个团队是由产品搞定这些事的,如果大家想做一样的事情,欢迎加入我们~(突然广告,JD参考上个贴)。
34
小猴冲冲
11月前
很遗憾看到Alexandr Wang和Dario Amodei面对竞争的第一反应是号召国家封锁,想到这两年还看过一些吹这两个人的播客,播客中的他们一个是MIT天才辍学创业少年,一个是屠龙勇士,现在才发现格局就只有这么点。

准备尝试把新财年的API预算由Sonnet换为V3&R1了,即使可能需要一些时间来解决模型自我意识太强的问题。
20