即刻App年轻人的同好社区
下载
App内打开
敖特_Aute
322关注791被关注0夸夸
AI startup founder
Ex 美团/光年之外 PM

Context is everything
敖特_Aute
6天前
不是,这两天为 Pretext 欢欣鼓舞的人有多少在前两周还无比赞同 「GUI 已死 / 还在做GUI 的公司都完蛋了」

注:Pretext 是个GUI 库,本条没说 Pretext 不好的意思(但这个上涨趋势,谁说Coding不能做内容平台了?🐶
01
敖特_Aute
16天前
在一些特殊场景,想要控制 Agent 的工具调用,既没有合适的规则去做约束解码,System Prompt 也写无可写,还能怎么办,我们实践出一种比较 tricky 的“诱骗”方法

具体的例子(做了简化):

Agent 为了不污染自身上下文,发起异步让子 Agent 完成某任务

为了让主 Agent 有完善的异步能力,除了异步发起工具,还需要有查询、插入指令、结束等配套工具

由于异步任务可能会执行很长时间,所以用户中途询问进度是很常见的,我们期望中的模型行为是查询并反馈用户进度即可,但是在非常多的时候,模型会进入:无限轮询、杀掉子 agent 重启任务、自己上手再干一遍等浪费低效的路径。

并且如前面说,这种情景即没有很好的规则可以通过约束解码控制工具调用,只在 System Prompt 里做约束也效果更是十分有限

我们尝试的方向是给模型提供一个新工具:加速工具。入参 Agent ID,并在工具描述里向主 Agent 承诺该工具可以将任务处理速度提升xxx

我们不用也无法真的实现这个工具的加速能力(否则也不叫诱骗了),而是再模型调用该工具时返回你已经写在System Prompt 里的约束进行再次强调,就能很大程度缓解问题

总结一下:如果能在 log 中识别到模型高频陷入的无效路径,可以通过设计一个“诱饵”工具,用一个看似更符合情景的选项把它矫正回来
04
敖特_Aute
27天前
让普通用户为 Agent 准备一台独立且网络长期稳定的设备是奢侈的,只有跑在云上的 Agent 才能保障持续运行永久在线

但另一方面,一个 Agent 如果只有云环境而没有本地行动能力,不能在离用户最近的地方拿到个性化上下文,不能利用/接管本地的一些现成工具,那么普通用户使用它的输入成本就很难降到合理水平

一个合理的结构是,harness 在云上作为智力与记忆的中枢,用户的各类端设备/应用(本地应用+云应用)作为眼睛与手脚通过网络协议接入
33
敖特_Aute
1月前
去年下半年,我正在筹备这次创业,想做自己最有热情的方向,除了已有的合伙人,还缺少一位某领域的技术专家加入。人很难找,所以在找人的同时也在看是否能从不同的角度去做

关于我最有热情的方向,如果抽象一些来描述,它更偏消费端,要寻找不同角度,自然的,便导向了供给,通过 AI Coding 来创造更多供给

当时最热的、给非程序员用的 AI Coding 产品是 Lovable,数据猪突猛进,它的故事是:每个人都能搭建自己的网站来服务自己的用户

这建立在高价值流量来自人类客户的基础假设之上,我们认为这不能很好的描述未来

所以我们要做一个 Lovable Copy ,别的都大差不差,核心区别是 Lovable 给用户交付的是一个人类友好网站,而我们给用户交付的是一个人类友好的网站+一个基于MCP、A2A 或者其他随便什么对 Agent 友好协议的接口服务 —— 让你的业务为 Agent 流量做好准备,所有服务都值得为 Agent 重做一遍

并且对于我们自己,在积累足够多服务之后,还能从工具转平台,做服务分发和服务抽成

在龙虾大火的当下,这几乎就是最风口的故事,在那个时点,我们却收到了不少来自投资人的挑战,相对给 Agent 搭友好的服务,大家甚至更相信 Coding 是新内容形态,可以长出新的内容社区

我们不得不往这个故事里塞东西:谁要建网站?当时的 Lovable 有什么问题?

谁要建网站?
北美欧洲没有大众点评,只有 Google map。大众点评既有列表页又有详情页, Google map 只有列表页,详情需要这些小商家自己搭官网,产生大量建站需求,所以我们要为北美欧洲小商家建站而服务

当时的 Lovable 有什么问题?
当时的 Lovable,几乎就是个原型工具,无法稳定维护生产级的带后端业务的站点。小商家所需要的官网会涉及会员、预定、电商这类带后端且零 Bug 容忍度的业务组件,没必要每次都让 AI 0 写,费 token 不说,主要是质量不够生产级,容易有bug,所有这些都应该预制好,让 AI 直接复用

这俩问题我们的回答,也是当时不少团队的共同思路。经过几个月,大家开发的差不多了,便扎堆上线了一批“生产级”Coding Agent(包括Lovable自己)。还有那个 AI Coding 社区,也开始讲起了小商家建站的故事

然而无人关心了,因为龙虾的大火,投资人和自媒体说他们要第一版,要那个为 Agent 做基建、为 Agent 做服务、为 Agent 搭平台的版本

(以上无论是第一版还是挑战应答版,我们都没去做,最终还是选择了那个自己更有热情东西去投入
45
敖特_Aute
2月前
Anthropic 封锁国内访问

-> 逼出大量程序员“中转”刚需

-> 养活一堆 API 二道贩子,各种 CC 中转站

-> 截胡海量真实 CC 、Codex、 Gemini 编程数据

-> 倒卖给国内基模厂,比起自己苦苦构造 Query 蒸馏数据,数据丰富度真实性都爆增、还不用操心封号合规、还巨特么便宜

-> 国产模型 Coding 能力大跃进
2431
敖特_Aute
2月前
很早期的视频生成模型就能直出分镜,虽然那时分镜烂、画面也烂

我一直非常疑惑,为什么在所有人都预期模型画面水准会快速提升的同时,大量的创业者和投资人会认为模型分镜水准会长时间原地踏步,并以此判断为基础在过去一年内堆出了 N 个视频 Agent / 剪辑 Agent 产品
33
敖特_Aute
2月前
朋友:市场热到,但凡有个还不错的候选人,拿的都不是 Offer 而是 TS

王慧文: 这市场热到我有点中暑的感觉😰

00
敖特_Aute
8月前
21