#Build in Public#
分享🌀周末AI coding - 基于OpenAI的GPT-Image-1 API生成海外app的全屏推广素材的批量素材生成系统🖥️
1️⃣实际运营工作落地场景🧨
海外的中小广告主app推广广告素材大多以icon位为主,需要全屏衍生素材来填充闪屏等全屏素材资源位,批量全屏素材设计依赖设计师输出慢,传统的基于icon图批量生成全屏素材的方式一般是做模板填充(从icon取色作为全屏图的背景色,中间填充icon图,底部设置固定的CTA button)模板填充生成的全屏素材单调,质量差。在GPT4o图像生成功能推出后(背后是GPT-Image-1 model)我们一般是人工的形式通过固定的prompt与GPT对话生产对应app的全屏素材,最近在开通了Claude Code后尝试将整个工作流做成批量自动化脚本
2️⃣GPT-Image-1 api介绍包括成本等💲
首先,整个系统主要用到GPT-Image-1模型,GPT-Image-1主要支持文生图(generations api),图生图(edit api),支持图片尺寸3种规格(1024x1024, 1536x1024 (landscape), 1024x1536 (portrait), or auto (default value)),同时还支持图片编辑等功能,由于本次的需求不涉及所以没有研究其他api。实操下来这个广告素材生产的脚本调用GPT-Image-1 api 每生成1张图片大概消耗6k token(quality为high)折算大概是0.24$ per image
3️⃣Cursor+ChatGPT+Claude code结合的AI coding实践流📑
这里由衷感谢🙏舒佬
@云舒的AI实践笔记 提供的CC实践教程,受益匪浅!!我的实践流基本上是站在舒佬肩膀上迭代的。大致实践流如下
⏩️从openai api doc把GPT-Image-1 api相关的信息给搬运下来,放在api research.md文件里做api预研
⏩️用PRD文档梳理提示词在GPT-o3,基于背景需求梳理prd1.0.md放在prd文件夹里
⏩️基于api research.md和prd1.0.md用Claude Code生成技术方案文档tech_solution1.0.md放在tech_solution文件夹里
⏩️用Claude Code基于prd1.0和tech_solution1.0开发代码,开发文件都放在[ProjectName]文件夹里(记得shift+tab切换为Planning mode)
✴️代码生成后基本上改1-2轮运行bug后就可以正常运行了,建议脚本的实际运行可以自己在终端运行,不需要在Claude Code里运行(节省token),在使用Claude Code的过程中有几个指令非常好用!!
✏️/init 生成CC对整个项目的理解文档Claude.md,可以在每次代码有更新时运行,Claude.md会对应更新总结内容
✏️/compact 在对话上下文要清空时(CC从剩余20%时会提醒)可以使用,用于总结聊天记录并清空详细聊天信息
✏️/resume 回到上次聊天进度
另外整体AI coding在Cursor界面分区域工作(见图一)
4️⃣素材生成效果🖥️
基本上是基于app icon图及prompt生成的全屏素材,示例如图二三(质量和风格还可以通过调优prompt进一步优化和定制)
5️⃣脚本开源💻
以上,将脚本开源
github.com,脚本支持的功能比较多,大家可以去看看readme.md,欢迎大家指导!👏