即刻App年轻人的同好社区
下载
App内打开
莫尔索
2月前
备份下 Nano Banana Pro(仅限Google Cloud: ai.google.dev) 开发的一些注意点:

1. Nano Banana Pro价格不便宜:生成一张 1K 或 2K 的图片费用为 0.134 美元,而 4K 图片则为 0.24 美元(此外还需加上输入 Token 和文本输出的 Token 费用),Batch API 可以节省 50% 的成本,最多等待 24 小时

2. 支持启用思考模式(参数include_thoughts=True),可以自动扩展提示词,自动脑补画面(成本也会上升)

3. 支持搜索工具模式(Search Grounding),可以用在生成生僻内容(「蚂蚁上树」的餐图)和包含最新数据(天气预报可视化)的场景上

4. Nano Banana Pro的图像直出翻译很稳定(翻译PPT图表有福了)

5. Nano Banana Pro 最多支持输入 14 张图片

Nano Banana Pro 提示词技巧(ai.google.dev):

1. 极度具体(Be Hyper-Specific): 你对主体、颜色、光线和构图的描述越详细,你对输出的控制权就越大。

2. 提供背景和意图(Context and Intent): 解释图片的用途或想要的情绪。模型对语境的理解会影响它的创作选择。

3. 迭代与优化(Iterate and Refine): 别指望一次就能完美。利用模型的对话能力进行增量修改,逐步完善你的图片。

4. 分步指令(Step-by-Step Instructions): 对于复杂的场景,将你的提示词拆解为一系列清晰、顺序的指令。

5. 正向描述(Positive Framing): 尽量少用“不要汽车”这样的负面提示,而是正向描述你想要的场景:“一条空荡荡、荒凉的街道,没有任何交通迹象。”

6. 掌控镜头(Control the Camera): 使用摄影和电影术语来指导构图,例如“广角镜头(wide-angle shot)”、“微距镜头(macro shot)”或“低角度视角(low-angle perspective)”。

7. 善用搜索: 当你知道想要模型使用实时或现实世界的数据时,要非常明确。比如,“搜索关于里昂奥林匹克队上一场比赛的信息并制作一张信息图”,效果会比仅仅说“一张里昂奥林匹克队近期比赛的信息图”要好得多(后者可能也能行,但别碰运气)。
16

来自圈子

圈子图片

JitHub程序员

389686人已经加入