即刻App年轻人的同好社区
下载
App内打开
阿晓Ocean
956关注1k被关注3夸夸
对世界保持好奇
阿晓Ocean
2天前
Harness Engineering:套束工程。
Agent Harness:Agent 套束。

“驾驭工程”给人的感觉是需要实时操控,这更像是 Copilot 时期的用户用法。

但是 Harness Engineering 更倾向于是给定一套约束,则 Agent 可以按照这套约束自行长期执行,因而“驾驭”这个词并不准确。

用“套束工程”这个词,一方面表达了这种只给定约束、不进行过多人工干预的思想;另一方面,也使得 Agent Harness 这个翻译能够用同样的中文翻译,且毫无违和感。

桑文锋SensorsData: Harness Engineering 中的Harness怎么翻译?是个有趣的问题。用马具听着不好听,用马鞍又不贴切,因为Harness其实是指控制系统的连接层,在驾驭马干活的场景里,它是指缰绳、颈套之类的。我也看有的文章里用线束这个词,原来在航空航天领域更早的复用了这个词,用来表示线路连接的设计,保证信号传递的稳定可靠。在Agent工程的场景,我看现在的用法里,既包含了连接层,又包含了执行层如工具等,现在还处于概念形成期。

21
阿晓Ocean
5天前
当大家开始使用“上瘾”、“戒断”、“复吸”这种词汇来形容一个产品使用或无法使用的体验时,那么这款产品大获成功的前景已经成为了一种必然。
00
阿晓Ocean
6天前
“圈养工程”的核心是那个“圈”字,用行业术语也可以叫做“闭环”,更时髦一点的话则是 "human on the loop"(区别于没闭环的 human in the loop)

阿晓Ocean: 建议Agent Harness 翻译成“代理圈套”,Harness Engineering 翻译成“圈养工程”🐶

00
阿晓Ocean
7天前
GPT-5.4 虽然在很多复杂的场景下,真的具有逻辑思维和业务理解能力,但同时却在另一些需要常识的任务中翻车。

如果任务指令不够明确,而是暗含了一些常识性原则,它只会按照指令字面的意思去执行,却不会同时考虑到一些未指明的常识,从而得到本本主义的结果。

在这一点上,Opus 4.6 GPT 5.4 要好不少。

但另一方面,Opus 4.6 的执行太多是基于常识与预训练的语料,基于这个世界已有的行为模式,而并不理解一个真正创新、独特场景下的一个新的模式。

它很难得到严密逻辑推理下的结果,在 debug 方面也会出现诸多的幻觉与漏洞。

简而言之: GPT 5.4 有逻辑、没常识; Opus 4.6 有常识、没逻辑。

做日常、文科、或商业类非严密逻辑推理的任务时,用 Opus 4.6 更加轻松。而在处理理工科、编程等需要严密逻辑推理的任务时,用 GPT-5.4 更准确。

阿晓Ocean: 和 GPT-5.4 合作的过程中,第一次感受到大模型真的能“理解”了。也就是在一个创新的、互联网上没有相同设计的业务场景/规则系统下,真的能进行严格的逻辑推理,问题比我想得清楚和严谨了。

00
阿晓Ocean
9天前
GPT-5.4 合作的过程中,第一次感受到大模型真的能“理解”了。也就是在一个创新的、互联网上没有相同设计的业务场景/规则系统下,真的能进行严格的逻辑推理,问题比我想得清楚和严谨了。

阿晓Ocean: 大模型了解了很多,理解了很少。

11
阿晓Ocean
12天前
建议将 Pooling 翻译成“汇集”
00
阿晓Ocean
12天前
建议将 Embedding 翻译成“内质”
10