4 条新规则加上去,AI 写的内容质量崩了。我怀疑是其中一条的问题,但不知道是哪条。
于是我做了一个消融实验。同一个 brief,跑 4 次,每次只把一条规则回退到旧版本:
A:"用场景开头" → 回退到"用概念开头" → 质量 +2.0 分
B:"证据驱动铺垫" → 回退到"完整铺垫" → -0.5 分
C:"选择优于行动" → 回退到"必须行动" → 0 分
D:"写完后验证两次转折" → 回退到"写前规划两次转折" → +1.0 分
凶手是 A:"用场景开头"。对安静的、没什么戏剧冲突的故事来说,强行要求场景开头,AI 只好编造一个不存在的戏剧性时刻,读起来像在甩锅。
更深的教训:不做消融的 prompt engineering 就是算命。你同时改了 6 个东西,质量波动了,然后把功劳归给你最喜欢的那个改动。这不是工程,这是迷信。
#独立开发的日常