[速看Google I/O ‘23] Google用敌人的武器完成自己的究极进化
先用产品更新热场:
* Gmail: 已有的“智能回复”,“智能补全”功能外新加“智能撰写”功能。可以根据一句话命令自动撰写邮件,比如“申请取消航班的全额退款”。还能够一键实现“把邮件写得更长”的二次修改。
* Maps: 3D渲染地图从单一地点拓展到整条路线,用户可以借此提前预览A-B路线的沿途景色和路况,甚至连预测的天气状况和交通拥堵状况都被渲染出来。
* Photo: 从Magic Eraser变成Magic Editor, 可以对照片实现更加细粒度的物体擦除,天气背景变换,改变人物位置,自动补全没有照全的物体(比如演示里的气球束)等更加fancy的AI魔法
再用AGI进展炸场:
* 发布PaLM2基础大模型
* 一口气推出从小到大四个不同规格的大语言模型:蜥蜴,海獭,水牛,独角兽。最小的蜥蜴模型可以在移动设备上离线运行。
* 支持100+种语言
* 还推出了两个垂直领域的微调模型:Sec-PaLM用于检测恶意代码,Med-PaLM用于辅助医学诊断
* 下一代的多模态大模型Gemini已在测试中,即将推出
* 聊天机器人Bard大大大升级
* 由最新的PaLM2模型驱动
* 能用20+种程序语言写代码,还能注明代码出处方便溯源
* 输入可以包含图片
* 通过调用Google生态里的各路接口,回答里可以显示图片/地图等视觉化信息。
* 像OpenAI一样也提供其他APP的扩展,比如可以调用Adobe Firefly创作AIGC图片。
* 将向180+国家地区开放,即将支持40种语言
* 办公全家桶加入更多AGI魔法
* Google Doc一句话生成文字稿
* Google Sheet一句话制作表格
* Google Slides一键生成图片/逐帧讲稿
* Search Labs: 谷歌搜索范式突破
* 新的搜索结果页面直接变成一个巨大的聊天对话框,有机结合了聊天机器人的回答和现有的谷歌搜索结果
* Demo:当你搜索“适合5英里通勤能走山路的自行车”时,聊天机器人会告诉你“选择通勤自行车时需要考虑的三项重要指标”随后展示Google Shopping推荐的产品列表。
* 搜索广告依然会出现在所有回答之前
* 与传统搜索不同,新的谷歌搜索可以记住用户的对话并接受用户不断的跟进式(follow-up)提问
* 该产品还处于实验阶段,用户可以申请内测
* 云服务:已开放上一代PaLM模型的API接口给企业用户使用
总结
* 在大模型的研发上,作为深耕AI领域多年的老大哥,集中了人才和算力的谷歌一旦all in那就是行业标杆。
* 在AGI的应用上,谷歌这次也发力找到了自己的优势,以聊天机器人为支点将自家生态圈里的APP融会贯通,为用户的问题呈现出全网最丰富最可用的回答。将现有搜索结果重新排版嵌入对话框的形式也算是在接纳AGI和保全搜索(广告)业务之间找到的一个平衡点,能为真正的商业转型赢得更多时间。
* 总之,你大爷还是你大爷,Google这艘AI巨轮虽然转向花了点时间,但是一旦转向完成,那便是全速前进,快速超车,所向披靡。