即刻App年轻人的同好社区
下载
App内打开
歸藏
4月前
简短总结一下昨晚 Google I/O 发布会,重点侧重模型层面的内容。

全线开花,几乎覆盖了目前所有的生成模型类型:

- Gmini 1.5 Pro 宣布开始支持 200 万上下文,跨关键用例的一系列质量改进,例如翻译、编码、推理等”,但没有发布测试结果。

- Gemini Flash:这款更小的 Gemini 模型针对较窄或高频任务进行了优化,其中模型响应时间的速度最为重要。提到百万 Token 的价格比 GPT-3.5 要便宜。

- Gemini 模型家族的构成:

1. Ultra:“最大的模型”(仅在Gemini Advanced提供)
2. Pro:“最佳总体性能模型”(在 API 预览版中提供)
3. Flash:“轻量级速度/效率模型”(在 API 预览版中提供)
4. Nano:“设备上模型”(将内置于Chrome 126中)

- Gemini Gems 谷歌的 GPTs,支持自定义与 Gemini 的互动方式。

- Gemini Live :“使用声音进行深入的双向对话的能力。”,Project Astra 实时视频理解个人助理聊天机器人,就是基于这个能力。

- Gemma 2:6 月发布规模为27B(之前为 7B 2B),以一半的尺寸提供接近 Llama-3-70B 的性能。

- PaliGemma:谷歌的第一个视觉语言开放模型,灵感来自PaLI-3

- Veo:DeepMind 对标 Sora 的模型,HN 上有些体验过的人表示不太行,国际象棋的棋盘和棋子生成的都不对。

- Imagen 3:图像模型,能够理解人们自然书写的提示,生成更高质量的逼真图像,并且在渲染文本方面表现卓越。

- Music AI Sandbox:旨在彻底改变音乐创作方式的AI工具套件。用户能够全新创作乐器部分,轻松在不同曲目间转换风格。

- Trillium:最新的TPUs,在每颗芯片的计算性能上,相比上一代TPU v5e,实现了高达4.7倍的显著提升。
310

来自圈子

圈子图片

AI探索站

74659人已经加入