让4o 速读了下 tech report 🫡
Gemma 3 的定位
适合的场景 ✅ 轻量级部署(4B 可以在消费级 GPU 运行,27B 量化后也能在单张 24GB 显存显卡上跑) ✅ 高效推理(KV-cache 设计优化,支持长上下文) ✅ 多语言任务(在 XQuAD、FloRes 等任务上大幅超越 Gemma 2) ✅ 中等难度数学 & 代码任务(比 Gemma 2 强,但仍逊色于 GPT-4 级别)
不太适合的场景 ❌ 高难度推理任务(AGIEval, BBH, ECLeKTic) ❌ 顶级编程任务(LiveCodeBench, HumanEval) ❌ 超长上下文任务(128K 以上的任务)