一个 Skill 搞定 6 大平台信息抓取
分享一个我最近搭的 AI 信息抓取skill,代码我放到
github.com 中了。
这个skill预设了 AI 前沿理论、AI工具,投资理财、思维模型、家庭教育几个领域,一句话触发,它就自动帮我把各平台热点抓回来、总结成中文、存进我的obsidian知识库中,并自动同步到移动端,我每天起床打开手机即可以看到最新的推送消息。
具体流程拆解可以见图一。
1️⃣ 初始化 — 读取我的配置文件,自动创建当天的日期文件,还支持断点续跑(中途断了下次接着来)
2️⃣ 工具三级回退 — 优先用浏览器 MCP(能复用已登录的会话),不行就降级到内置浏览器,再不行就纯 HTTP 抓取,确保总能拿到数据
3️⃣ Feed 数据源 — 自动拉取 Follow Builders 的推文聚合和播客聚合 JSON,总结成中文写入
4️⃣ 主题检索(核心) — 逐个主题在对应平台搜索:
技术类(AI 工具 / LLM 理论 / 具身智能)→ HuggingFace Papers + X
软技能类(思维模型 / 投资管理 / 家庭教育)→ YouTube + Reddit
每个主题提取 10+ 条,自动翻译总结成中文
5️⃣ 关注账号追踪 — 10 个我长期关注的 X 大 V,每人抓最新 3 条动态(Karpathy、Jim Fan、Ethan Mollick 这些大佬全在里面)
6️⃣ 写入完成标记 — 全部抓完打个 all_done 标记
7️⃣ 自动同步 — 通过 Obsidian CLI 调用 Remotely Save 插件,一键推送到云端,手机上也能随时看
最爽的几个点:
✅ 每一步抓完立即写入文件,不怕中途崩溃丢数据
✅ 断点续跑,上次跑到哪就从哪接着来
✅ 所有信息自动翻译成中文摘要,不用自己啃英文
✅ 输出就是一个 Markdown 文件,直接进 Obsidian 知识库
✅ 主题、平台、关注账号全部可配置,改个配置文件就行
我的配置参考图二。
有同样需求的朋友可以参考这个思路,根据自己的兴趣领域定制!