即刻App
年轻人的同好社区
下载
App内打开
尚晋
293
关注
773
被关注
5
夸夸
Building AI Stuff
ex AI Engineer@Google&WeChat, MSCS@CMU, NYUAD
尚晋
21:37
去年还想着腾讯/微信可以憋个大招,但从今年的种种迹象来看,腾讯是一家彻头彻尾的落后企业
10
4
1
尚晋
2天前
CLI有三点好处
1 不用额外开发
2 符合渐进式披露原则,也相当于自带skill
3 可以pipe接sed/jq/grep/head/tail等省token和context
很适用于一切获取数据和无状态操作
10
0
0
尚晋
2天前
最早确实是马术的缰绳→汽车的控制线束→工业测试的线束,但后来工业测试的所有套件都叫harness,演进了n次之后含义变广了很多
尚晋: 最近看到很多说harness是从马术过来的词,这显然是很难理解的。 其实在软件行业应该是从test harness(测试套件)过来的,它是指在一个完整测试过程中,除了被测试的软件外所有其他部分,包括输入数据、调用方、执行引擎等等等。 所以现在才会有“一个agent产品中模型之外的部分都是harness”,是从test harness一脉相承过来的,对应的组件就是context,trigger和runtime
3
0
1
尚晋
2天前
最近看到很多说harness是从马术过来的词,这显然是很难理解的。
其实在软件行业应该是从test harness(测试套件)过来的,它是指在一个完整测试过程中,除了被测试的软件外所有其他部分,包括输入数据、调用方、执行引擎等等等。
所以现在才会有“一个agent产品中模型之外的部分都是harness”,是从test harness一脉相承过来的,对应的组件就是context,trigger和runtime
12
3
2
尚晋
3天前
果然一个月后这个名词火了,看起来什么新东西都有至少一个月的窗口期
尚晋: agent产品=模型+agent harness,模型能力变强了,给它合适的harness,就是新的agent产品 ps:harness这个词中文没有很好的翻译,所以没怎么见大家用
10
3
0
尚晋
3天前
现在codex上的GPT5.4,一个run跑一个小时 轻轻松松,在外面接了multi agent之后,甚至一个任务跑8个小时都很轻松
1
0
0
尚晋
4天前
stripe的projects.dev是个hidden gem
5
0
0
尚晋
4天前
昨天看
@1988的黄沁
的文章非常感同身受,除了完成更长程、更复杂的任务之外,下一代Agent harness产品很重要的功能是一个“地图”:当你有10个Agent 每天24小时地干活,它们带来的“认知混乱”会给人一种“迷路”的感觉。
人类不可能像过去Manus和claude code的那样盯着它一句一句地生成,更结构化的展现方式是更合理的,这里可能也会有generative UI的空间。
10
0
0
尚晋
4天前
古法agent harness:睡觉之前给codex留message queue,就可以一直干到早上
11
5
2
尚晋
12天前
当下agent距离终局还缺的三个infra(技术角度):
1. 云端持久运行机制
2. Multi agent native orchestration和workspace
3. 自动的event driven trigger system
至于memory、context engineering之类的更多是个抽象概念,需要基于domain雕花,不一定存在通用解
33
5
8