即刻App年轻人的同好社区
下载
App内打开
MLOasis
74关注121被关注0夸夸
机器学习&数据科学
Talk is cheap, Do something.
博客:mloasisblog.com
公众号:MLOasis
MLOasis
3天前
直接把文档转成图片交给 vlm 可能是更好更大一统的文档解析方式,而不用淹没在一大堆 OCR 设置中。
00
MLOasis
4天前
上下文工程成为关键缺口

“当AI编码试点项目失败时,我们需要停止归咎于模型,“领英[MSFT -1.02%]生成式AI开发负责人Dhyey Mavani在12月12日发布的分析中写道。“通常不是因为大语言模型不够智能。而是因为我们面临系统设计挑战。”[venturebeat +1]

Forrester分析师Devin Dickerson在12月13日撰文指出,“智能体漂移”是隐形的生产力杀手——当AI编码智能体出色地实现功能时,却完全忽略了既定的数据库架构或导致意外的回归问题。“由于上下文缺失,团队正在花费大量时间与他们的智能体作斗争,“Dickerson写道,并指出这个问题不能仅靠更好的模型来解决。[cdotrends +2]

根据这两份分析,解决方案在于将上下文视为一门工程学科,而不是事后的补充。成功的团队正在构建工具来捕获、压缩和版本化他们智能体的工作记忆——包括相关模块、依赖关系图、测试框架和架构标准。[cio +1]

未改变的工作流程造成摩擦

根据报告显示,当企业在未重新设计工作流程的情况下将AI代理插入现有流程时,摩擦会增加。工程师花在验证AI生成代码上的时间比自己编写代码的时间还要多。麦肯锡2025年的研究发现,只有6%的组织符合”高绩效者”标准,从代理式AI中获得显著的财务影响,而成功部署的组织完全重新设计工作流程的可能性高出2.8倍。[sabaisystem +2]
Forrester的分析强调了正在获得关注的实际实施方案,包括开源的Conductor方法论,该方法使用markdown文件——如prompt.md、architecture.md和workflow.md——为AI代理提供持久的结构化上下文。Dickerson解释说:“在存在上下文空白的地方,编码代理往往会用自己的假设来填补这些空白”。[cdotrends +2]

GitHub在12月宣布为其Copilot Agent推出企业控制功能,包括集中治理和预算跟踪,同时强调代理必须仅使用可见的、由维护者提供的上下文,并对不可逆更改保持人工监督。Anthropic [GOOG -1.00%] 发布了指导建议,推荐针对复杂任务使用专门的子代理,以及采用”即时”上下文加载而非预先处理所有数据。[buildfastwithai +2]

新兴的共识是:没有编排的自主性很少能产生效率。随着团队将AI编码工具从初步试点扩展到更大规模,上下文工程——管理代理看到什么信息、何时看到以及以何种格式看到——已成为生产力提升与昂贵瓶颈之间的决定性因素。
00
MLOasis
16天前
又一个月了
00
MLOasis
17天前
第一次睡眠评分达到 100
00
MLOasis
24天前
00
MLOasis
1月前
分享下近期阅读的各种内容

https://mp.weixin.qq.com/s/E958sbW8ONxMwEJ_8wbdVg

00
MLOasis
1月前
Moonshot(kimi) 的曲线斜率过于亮眼了😂几乎追平 OpenAI
11
MLOasis
1月前
珍惜 SOTA 模型的上下文窗口,让模型对输入输出做复制粘贴的工作实在是不可接受😂
00
MLOasis
2月前
懂与不懂,都看自己心情,压力大就多休息,毕竟,少量的知识令人愉快,大量的知识令人作呕。
00
MLOasis
2月前
00