Lex Fridman 与 Cursor 的创始团队的对话
www.youtube.com根据播客内容,Cursor 团队认为 Claude 3.5 Sonnet 目前是配合 Cursor 使用的最佳模型,尽管没有哪个模型能在所有方面都做到最好。
综合能力最佳: Aman 指出,虽然其他前沿模型(例如 o1)在推理密集型任务(如编程面试题)上表现出色,但 Sonnet 在理解程序员的粗略意图方面更胜一筹。 这意味着在日常编码中,Sonnet 能更好地预测程序员接下来的操作,提供更符合心意的建议。
泛化能力更强: Aman 认为,其他模型可能在基准测试中表现优异,但在实际编码场景中,Sonnet 在处理基准测试范围以外的任务时,能更好地保持其能力。实际编码往往比基准测试更混乱、规范性更差,Sonnet 的适应性更强。
没有一个模型能够在速度、代码编辑能力、代码处理量、长上下文理解和编码能力等所有方面都占优。
需要补充的是,Cursor 团队强调他们不断在评估和尝试不同的模型,并根据实际体验和需求进行调整。 他们也致力于训练自己的定制模型,以弥补现有模型的不足,并针对 Cursor 的特定功能(如 Cursor Tab 和 Apply)进行优化。 所以最佳模型的选择也可能随着技术的发展而变化。