最近帮朋友用 AI 做 PPT,顺手调研了一圈业内已有的方案,比如:Google NotebookLM、Gamma、Banana Pro、Cova 等。
看下来感觉这些工具各有特色,但在实际使用过程中,突然意识到:用 Claude Code 自己搭一套 workflow,好像也是个很不错的方案。
大致的实现流程其实很简单,而且非常工程化:
1)AI 根据主题生成一份 PPT 结构化网页(HTML)
2)然后让 AI 调用 Chrome CDP 协议 打开页面并截图保存
3)最后让 AI 再通过命令行工具,把截图转换为 PPT / PDF 文件
这样做的好处是:
• 生成速度更快
• 稳定性更高
• 可控性更强
• 调整成本更低
相比之下,直接让 AI 生成 PPT 图片或复杂文件结构,反而更重、更慢,也更难维护。
更有意思的一点是:
如果需要生成 可编辑的 PPT,其实也是“言出法随”的事情。因为底层仍然是基于网页内容去渲染,只要把 HTML 结构映射到 PPT 组件(文本、图片、表格等),就可以直接输出标准的 .pptx 文件。
从工程角度看,这里有一个很关键的认知转变:
PPT 本质上只是展示层,而网页才是更低成本、更易维护的中间形态。
另外,把这一整套 workflow 封装成一个 skills / pipeline 之后,体验会非常丝滑:
输入主题
↓
生成网页
↓
截图 / 渲染
↓
导出 PPT / PDF
下一次只需要一句话:
生成一份「XX 主题」的 PPT
就可以直接产出文件。
效率提升是非常直观的。
这件事给我一个很直接的感受是:
很多时候不是工具不够,而是思路一旦打开,解决问题会方便得多。
;)