如果让我自己思考AI产品的infra和agent,那infra大概是搭建、评测、观测。
在这三个词上
• 搭建:模型节点和依赖资源、非模型的代码节点,运行的框架以及发布的渠道。在资源部分会有模型、提示词、mcp、知识库、skill
• 评测:端到端、节点级别,再加上评测集、评测的指标、和能够运行的任务,指标层面会有代码、模型评分,前者是绝对性、后者是开放性
• 观测:输入输出、质检评分、用户反馈,以及状态、成本、耗时。
到了agent部分
• 框架:是agent还是工作流
• 模型:每个节点承载什么事情,用什么模型、提示词
• 依赖:知识库,然后知识库要怎么解析、切片、召回、过滤、重排;mcp/skill,具备什么能力,要怎么使用
• 思考/规划:要不要思考,要怎么制定计划
• 上下文;存储、丢弃、压缩、转记忆
• harness:沙盒、审批、重试、安检
• 会话:会话调度策略,怎么进线、要不要合并还是串行,要不要给响应,怎么输出
• 记忆:什么才算记忆?
• 体验:定制化的消息格式、快捷工具、agent路由,推荐的问题
大概是这些,然后就是无尽的优化