即刻App年轻人的同好社区
下载
App内打开
小猴冲冲
326关注1k被关注0夸夸
以古典之心,行AI之事
小猴冲冲
12天前
即将加入一个心仪已久的基模团队做产品

心中有两个大大的梦想:
- 帮助模型在Agent能力上击败Anthropic,让更多人摆脱讨厌这家公司却又不得不用的困境
- 能在被载入史册的Paper上看到自己的名字,获得在数字世界上的永生
80
小猴冲冲
5月前
工程师耗费数年把商品检索时间由0.8s缩为0.5s,结果来了一位AI产品,把检索框换成了对话框,让用户先看10s的深度思考,5s的工具调用,最后推几个普通的商品,还要再花3s说明推荐理由。

算法耗时数年优化目的地推荐,成功把目的地推荐的准确率提升到了80%,让用户无需输入即可叫车,结果来了一位AI产品,把推荐词换成了助手入口,让用户输入内容由目的地变为一句话,模型傻乎乎的分析了半天给出了三个不知道怎么选的选项。

古典产品致力于别让用户想,别让用户等。
一些AI产品偏要让用户想,让用户等。
00
小猴冲冲
7月前
Claude断供后最大的惊喜是发现K2近乎能平替4 Sonnet在Multi-Agent调度任务上的表现,而且速度更快,而GPT5却常常偷懒漏调用工具(尤其单轮工具>3的情况)。#再见Claude
20
小猴冲冲
8月前
如果一个问题的解决方案太复杂,很可能是解决方案错了,更可能是要解决的问题错了(回顾一个20个节点的LLM Workflow有感)
00
小猴冲冲
12月前
A2A的出现看起来解决了一些Agent协同的通信问题及过程显示问题,任务状态管理、流式输出/推送机制、上下文交换、多类型输出,解决了很多工程上的问题,虽然可能模型的问题还存在,但预感未来结合更好的动态规划执行模型和MCP生态,Multi-Agent会变得越来越可落地

小猴冲冲: 纯自主规划的 Multi-Agent在生产环节的落地还是太难了,一会儿漏掉工具,一会儿搞错顺序,一会儿重复说话,更别提LLM as Tool的时延和产品化解析的复杂度了。感觉有调框架和模型的功夫,早都搭出来稳定能并行节点的DAG Workflow了… 人类总是希望纯粹的智能,但又以“做事流程是否符合自己预期”为评判标准,在现阶段还是太矛盾了。

00
小猴冲冲
1年前
写prompt最快乐的时刻就是删减和格式化,这何尝不是新时代的诗呢
31
小猴冲冲
1年前
纯自主规划的 Multi-Agent在生产环节的落地还是太难了,一会儿漏掉工具,一会儿搞错顺序,一会儿重复说话,更别提LLM as Tool的时延和产品化解析的复杂度了。感觉有调框架和模型的功夫,早都搭出来稳定能并行节点的DAG Workflow了…

人类总是希望纯粹的智能,但又以“做事流程是否符合自己预期”为评判标准,在现阶段还是太矛盾了。
32
小猴冲冲
1年前
大厂很多AI项目的分工还没有跟上时代,还是产品写PRD和流程图->技术评审->技术出方案写Prompt搭Workflow,但实际上产品可以直接跳到最后一步。

引入了工程团队的项目,往往会执迷于自己接入API自建一套工作流平台,最终发现是重复造轮子。

引入了算法团队的项目,往往会执迷于做Pre-Train和SFT,对提示词工程和流程编排的琢磨并不会投入大量时间(可能是因为无法体验算法价值),这其实是产品的机会。

最近才发现没有几个团队是由产品搞定这些事的,如果大家想做一样的事情,欢迎加入我们~(突然广告,JD参考上个贴)。
34
小猴冲冲
1年前
很遗憾看到Alexandr Wang和Dario Amodei面对竞争的第一反应是号召国家封锁,想到这两年还看过一些吹这两个人的播客,播客中的他们一个是MIT天才辍学创业少年,一个是屠龙勇士,现在才发现格局就只有这么点。

准备尝试把新财年的API预算由Sonnet换为V3&R1了,即使可能需要一些时间来解决模型自我意识太强的问题。
20