重磅发布的GPT-4o以及ChatGPT产品的最全总结:
🌟GPT-4o(“o”代表“全能”)
它可以接受任意组合的文本、音频和图像作为输入,并生成任意组合的文本、音频和图像输出。
它可以在 232 毫秒内响应音频输入,平均为 320 毫秒,这与人类在对话中的响应时间相似。
在英文和代码文本方面,它与 GPT-4 Turbo 的性能相当,对非英语文本的文本有显著改进。
同时在 API 方面更快速、价格更便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面表现特别出色。
与 GPT-4 Turbo 相比,GPT-4o 速度提高了 2 倍,价格减半,限制速率提高了 5 倍。
🌟何时可用?
目前,GPT-4o的文本和图像功能已经开始在ChatGPT中逐步推出,用户可以在ChatGPT平台上免费体验到GPT-4o的相关功能,但免费版有使用次数限制,Plus用户可以享受到5倍的调用额度。
在接下来的几周内,OpenAI计划将在ChatGPT Plus中推出Voice Mode新版本,该版本带有GPT-4o。这将作为ChatGPT Plus的一个alpha版本提供给PIus用户。
此外,GPT-4o也将通过API提供给开发者,作为文本和视觉模型。开发者可以利用AP来集成GPT-4o到他们自己的应用程序中,而且GPT-4o在API中相比GPT-4Tubo更快、更便宜,并且有更高的速率限制。
至于GPT-4o的音频和视频功能,OpenAl将在未来的几周和几个月内继续开发技术基础设施、通过训练后提高可用性以及确保安全性,之后才会发布这些功能,并逐步向公众提供。
🌟体验感受
1.新的 GPT-4o 模型:打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换
2.GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。在你说完话的下一刻,GPT就可以给你回答,不需要那些2-3秒的尴尬等待
3.GPT-4o 向所有用户免费开放 4.GPT-4o API,比 GPT 4-Turbo 快 2 倍,价格便宜 50%
5.惊艳的实时语音助手演示:对话更像人、能实时翻译,识别表情,可以通过摄像头识别画面写代码分析图表
6.ChatGPT 新 UI,更简洁
7.一个新的 ChatGPT 桌面应用程序,适用于 macOS,Windows 版本今年晚些时候推出
8、目前GPT Plus用户已经可以体验GPT-4o模型了,免费用户应该需要再等等!
公告地址:
openai.com#AI工作流 #AI的神奇用法