OpenClaw方向团队招Agent评估工程师实习生
💌简历投递邮箱: join@maxgent.ai,格式:应聘的岗位名称【XXX】+姓名+电话
【关于我们】 我们是一家面向海外市场、专注于 openclaw方向的初创公司,由美团联合创始人-王慧文重金投资。 团队成员包括:前字节seed 4-1高级算法科学家 ,chatbox创始人,全明星工程师和独立开发者。
💠【Agent 评估工程师实习生】
💎 岗位定位
你将参与构建 AI Agent 系统的评估体系,参与设计 benchmark、实验框架与评测方法,让 Agent 的能力提升建立在可量化、可验证、可复现的基础之上
💎 工作内容
● 设计系统评估指标,例如:任务成功率;执行轨迹质量(trajectory quality);工具调用准确率;稳定性与时延;推理成本
● 构建评测体系,包括:任务集和自动化评测流程;人工评审机制。实现评测基准的一致性、稳定性和区分度
● 与 Agent、模型、Sandbox、安全等方向协作,推动系统持续优化
💎 职位要求
● 有 LLM 应用、Agent 系统或复杂 AI 系统的评估经验
● 熟悉工业界和学术界的主流评测榜单,了解业界最新模型能力及其公开评测方式
● 熟悉实验设计与数据分析方法(A/B test、对照实验等)
💎 加分项
● 参与过 AI benchmark 或评测体系建设
● 开发过 Agent 系统或熟悉 Agent 架构
● 有论文复现或 AI 实验经验
💎 我们希望你是这样的人:
● 对 AI Agent 系统如何变强充满好奇
● 喜欢通过实验和数据寻找答案
● 能从复杂系统中定位问题并提出改进方案