用banana对一张图片做了一些微调以后,需要做成透明背景,但是这对于生成式AI是办不到的,它只能假模假样的生成一个看起来像是有alpha 通道的格子背景假装透明。直接看这个结果的话,可能会觉得ai不过如此,细致的场景还是得人用ps才能解决。
不过在明确指出生成的是假透明,让它用代码处理以后,ai就开始用一些库比如rembg来解决,到这里为止都是我的知识和能力范围。
但是rembg的效果并不好,毛边很严重,扣图效果很差,于是让ai分析为什么像photoroom这样的商业产品可以做的效果如此好,它balabala一顿分析,这时候我的脑力开始有些跟不上了,于是直接让它优化到photoroom的水平,把边缘处理好,然后ai找了个更优秀的模型BRIA RMBG-1.4,处理得到了边缘更锐利干净,有alpha 通道的图片。
到这里已经很惊艳了,但是有一个问题是,图片看起来色彩变淡了,说明alpha还是有问题的,不过我当时一时间没想明白,直接让ai去解决,于是多模态的gemini 3pro自己读了图,分析了一会,发现是alpha遮罩透明度不是100%的问题,做了归一化以后解决了。
上面的整个过程不到10分钟,到后面超出的我脑力和知识以后,就只有惊叹的份了,越来越理解当老板的快乐了。