Google 宣布在 Chrome 里集成 Gemini Nano,使用方法目前主要靠在Web API 中新增的具体「Task API」(比如 translation API,似乎还会有摘要、问答、分类、AIGC)来调用结合专家模型(或经过微调)的 Gemini Nano,后续可能在 Web API 里增加更通用的 Prompt API 和 Fine-tuning (LoRA) API
developer.chrome.comgithub.com这种模式不同于基于 WebGPU 在浏览器里运行 LLM,是直接在 Web 标准里增加 AI API。性能方面的区别主要是不用等待模型下载。Xenova 有很多基于 WebGPU 在浏览器里运行 AI 的 demo:
huggingface.co