外面全是吉卜力?一组漫画场景看透GPT-4o的「局限」!
原文🔗
mp.weixin.qq.comGPT4o的多模态生图上线之后热度一直居高不下,
连带着到处都是「吉卜力」风格的图片,
下面直接以一组漫画场景来看下GPT-4o的多模态生图能力的优缺点~
首先是优点方面,相信大家已经看到很多了,这里简单提几个:
1、高质量图像生成:
- 支持文本到图像的生成,也可以通过对话逐步完善图像
- 能够生成各种风格图像和复杂场景的结合
2、应用范围广泛:
- 在电商设计领域,可以实现商品图的翻译和合成、换产品换脸换衣服等效果,大大降低了生产成本。
- 在UI设计方面,能够快速生成UI图放样机的效果,提高了设计效率。
3、最重要的是操作便捷:
(正好甲木也不用花心思去学comfyUI了,初级需求基本已经满足..)
- 用户可以通过简单的对话指令来生成和修改图像,无需复杂的技术操作,降低了使用门槛。
主要来说说缺点,我们从这组漫画里面也可以看到:
1. 图像生成限制:
- 对于长图像,可能会出现剪裁问题。
- 在密集文本下,中文渲染不成熟,基本上有乱码出现。
2. 可能产生错误或幻觉:
- 有时可能会产生幻觉,开始胡编乱造,生成不符合用户需求或逻辑的图像。
- 生成的图像可能存在一些小错误,如手指细节问题、衣服随意变换错误等等。
3. 编辑功能的局限性:
- 对特定部分要求编辑时,可能会出现bug,无法精准地进行修改。
- 在专业设计领域,对于图像的精度和可控性要求较高时,可能无法完全满足需求,例如在处理复杂的产品图、品牌海报等时,可能存在比例、质感等方面的问题。
4. 使用限制:
- 在ChatGPT上使用时,可能会受到流量限制,生成一定数量的图像后需要等待一段时间才能继续使用。
首先,肯定OpenAI这次的更新比之前几次都要靠谱的多,确实在很多场景带来助力,而且效果比Gemini要强很多,其次,缺点也是显而易见的,在一致性保持方面,中文支持方面,使用频率方面还是需要提升和改进的。
又是一个人机协作新范式,大家赶紧去玩一玩吧~
(还有两张放不下了😂)