我觉得 AI 编程有三种很好的入手方式:
1. 编写自己用的小工具
你可以利用 HTML 直接实现从输入到输出并对接大模型。这种单 HTML 页面的开发,目前顶尖模型的生成成功率几乎是 100%(或者微调 2-3 次后肯定能达到 100%)。只要你不在意过于复杂的交互或信息处理,简单应用基本上是手到擒来。
(a) 应用场景:比如写工作日报,你已经有一套成熟的提示词,但每次复制到大模型里很麻烦。你可以做一个小工具,把当天的素材粘贴进去,它就自动产出结果。
(b) 进阶功能:还可以增加历史记录记忆,备份到本地或保存到浏览器记录里。
2. 和外部系统嫁接
将系统与飞书多维表格等工具对接,把多维表格作为数据库,实现内容的读写、爬取或增加。
(a) 深度绑定:目前很多小红书插件都是跟飞书多维表格深度绑定的。
(b) 自动化流:结合 AI 改写功能,这会变成一个属于你自己的工作流或套路。
3. 编写浏览器插件或脚本
利用油猴脚本(Tampermonkey)实现对浏览器内网页数据的抓取。现在编写一个 Chrome 插件比半年前或一年前容易得多,门槛大幅降低。我最开始的油猴脚本,是实现了小红书以及抖音的数据采集
在有了 Claude code或 OpenCode 这种agent之后, 在 26 年还会有很多的变化,但核心原理还是差不多的。
工具的生产已经可以实现批量化了。你只需给出需求提示词,它就能批量生成 HTML,甚至组合成小型网站。我实践后总结了一些比较好的技术路径:
* 前后端合一:后端应用 Flask 或 FastAPI,前端使用 HTML 加 JavaScript(推荐用 Vue 或 Alpine.js)。
* 系统对接:你甚至不需要亲自阅读 API 文档。直接告诉 AI 服务接口是什么,它会自己去读取内部、外部或你自建系统的 API 文档。
* 数据采集:利用 Playwright 或 Selenium 模拟采集网站数据。目前像豆瓣、小红书、B 站的数据抓取都很容易。
比如我刚刚就下载了 B 站里的 500 条视频音频,准备进行语音转文字处理。