「真正能干活的AI员工」其实反直觉地看要远比「 AI助理」容易做得多。
LLM 任务的难度,不由「野心」决定,由有没有可验证的目标决定。 而「总结未读消息汇报给我」恰是 LLM 的最坏情形:目标(什么对我重要)是(a) 主观的、(b) 私有的、藏在你脑子里、(c) 因人剧变、(d) 从不明说。
有损压缩的难点从来不是把话说流畅(这 LLM 顶强),是那个取舍函数——留什么、丢什么、把什么放前面——它本质是你的效用函数,而模型拿不到。 它只能塞一个通用效用函数进去:对任何具体的人,这就是「平庸的噪音」;对越高端的人越错,因为高端用户的「什么重要」恰恰最私有、最特异。
#等codex干活过程中的深夜思考