穷鬼打法考验的是能力,富人打法考验的是资源。当拥有三三制的能力叠加火力覆盖的资源,那从战略角度上来说,就可以实现不战而屈人之兵的效果。
工程思维是降本增效最有效的路径。除了向前堆算力外,还有一个可以考虑的方向是:如何在堆思考得过程中,降低重复消耗的token,使这一过程成本更低。也就是如何通过认知抽象找到通用模块、如何高效压缩+解码、如何灵活运用DSA与MoE在Cot中调用出通用模块、如何通过推理过程中的RL验证推理结果的有效性后输出最终结果,从而进一步在推理过程中取得降低token消耗与推理结果有效的平衡,即推理结果的性价比(一种时间、成本与结果的综合最优解),也可以称之为「经济型推理引擎」。
越复杂的系统,越考验系统架构师的全栈架构能力,需要在多种路径中基于自身优势与特点寻找到最优解,扬长避短,从而实现不同阶段、领域的SOTA。最优解不在任何极端,而在根据工作负载特征动态调整的帕累托前沿曲面上。
当能够点亮足够多的技能点后,从综合能力的角度来说,也就能够实现断崖式领先(即一种多层次能力在正确时间点的共振)。在考虑点亮点技能点时,也需要参考注意力机制的逻辑,沿着未来趋势选择主线附近的技能点(并考虑所需的理解深度),从而实现专注与全栈的平衡最优解。
这一过程也给人机协同提供了协同过程中的坐标系,在熟悉AI能力的情况下开展有效协同,知道哪些是它的优势,哪里会出现幻觉,通过主动干预将协同的轨迹限定在预期范围内,从而实现最有效的人机混合模式。