OpenAI官方博客刚发了篇推理类模型的最佳实践,指导如何更好的使用o1、o3这类推理模型,当然也可以应用在deepseek r1上,
platform.openai.com,可以参考:
1、保持提示简洁和明确:这些模型擅长理解简要且清晰的指令;提示不用写得过长或复杂。
2、避免“逐步思考”的提示:因为这些模型会在内部自主推理,不必显式告诉它们“请一步步解释你的推理过程”,这样做有时还会降低它们的表现。
3、使用分隔符以确保结构清晰:例如使用 Markdown、XML 标签、章节标题等,让模型知道不同部分的信息和用途,这能帮助模型更准确地理解提示。
4、先尝试零样本提示(zero-shot),再考虑少样本提示(few-shot):在很多情况下,你完全可以不给示例,直接告诉模型你的需求就行了。如果事情比较复杂,需要更精准的输出,可以加入少量示例(few-shot)。但要注意确保示例与指令相符,否则会引发混乱。
5、明确约束条件:如果你对结果有特别的要求(比如“请在 500 美元以内给出一个方案”),一定要在提示里写清楚。
6、阐述清楚你的最终目标:在提示中尽量详细说明你想要的成功标准,并鼓励模型持续推敲,直到满足这些成功指标。