即刻App年轻人的同好社区
下载
App内打开
Szhans
2年前
🚀 Open AI 春季更新:GPT-4o 惊艳的语音、全免费以及「科幻照进现实」

Hans 整理的Takeways:

- GPT-4o 带来了全新语音能力,颠覆了我们以往的人机交互范式
- GPT-4o 将免费开放给所有人,GPT Store 和 GPTs 也将全部开放
- 现在你就可以ChatGPT 客户端体验到如魔法般的新语音和新模型

🔗 直播回放地址: www.youtube.com
(GPT-4o 语音实时演示,从9:30 开始,不容错过)

📒 春季更新观看的 Notes:

1/ Open AI CTO Mira 认为GPT-4o 代表着人机协作的一个「范式转移」的新开始。

2/ 传统AI ,需要转录、预测和TTS文本转语音三个步骤, 会导致大量的延迟问题。 (这也不是人类使用语音交流的模式)
GPT-4o 有着巨大的改变, 跨越语音、文本和视觉进行推理,带来难以置信的效率。

3/ 非常重要的一点,GPT-4o 将向免费用户开放~ (接下来几周持续部署)

4/ 通过GPT-4o,GPT Store 也会免费开放给所有人。目前已经有一百万用户创建了 GPTs 。

5/ 除了优化过的多模态能力、记忆力等,还大幅提升50种不同语言的质量和响应速度。

6/ GPT-4o对应的API也在今天推出,相比GPT-4 Turbo,两倍快、价格便宜一半。

7/ 实时Demo演示中 , GPT-4o 响应速度惊人, 安慰了「呼吸急促」的Mark Chen,还表现出了深度的共情和幽默: 「Mark,你可不是吸尘器」。(背后是精彩语音推理能力)

8/ 相比之前语音模式,Mark 介绍GPT-4o 的独特性:a) 你可以随时打断TA,就像和人类沟通那样;b)新模型是实时响应,前所未有的低延迟。c) 新模型善于扑捉和分析情绪信息。

9/ 紧接着,Barrett 演示了协助完成数学计算过程,这个实时演示充分展示视觉+语音协同,以及推理的新高度。

10/ Barrett 还在ChatGPT 桌面端的语音模式下,进行了编程Copliot演示。 GPT-4o 全程的语音辅助模式和屏幕捕捉模式,一定会让工程师们觉得新奇不已。

11/ 最后,Mark 演示了「实时语音翻译」。 Mira 使用意大利语与Mark 实时对话,让人们再一次体会到了那句克拉克的名言:「任何足够先进的技术,都与魔法无异。」

🎉Amazing ~

One More Thing:

💡来自Sam Altman的最新的博文

在我们今天的公告中,我想强调两件事。

首先,我们的使命之一就是免费(或以优惠价格)向人们提供功能强大的人工智能工具。我感到非常自豪的是,我们在 ChatGPT 中免费提供了世界上最好的模型,而且没有广告之类的东西。

我们最初创办 OpenAI 时的设想是,我们将创造人工智能,并利用它为世界创造各种利益。而现在看来,我们将创造人工智能,然后其他人将利用它创造出各种神奇的东西,让我们都从中受益。

我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的人工智能服务(希望如此)。

其次,新的语音(和视频)模式是我用过的最好的电脑界面。它给人的感觉就像电影中的人工智能;而它的真实性仍然让我感到有些惊讶。达到人类水平的响应时间和表现力是一个很大的变化。

最初的 ChatGPT 展示了语言界面的雏形,而新的 ChatGPT 则给人截然不同的感觉。它快速、智能、有趣、自然,而且乐于助人。

对我来说,与电脑交谈从来都不是一件很自然的事,但现在却很自然。随着我们增加(可选的)个性化功能、访问您的信息、代表您采取行动的能力等,我真的看到了一个令人兴奋的未来,我们可以利用计算机做比以往更多的事情。

最后,衷心感谢为实现这一目标付出大量心血的团队!
1157

来自圈子

圈子图片

AI探索站

101236人已经加入