即刻App年轻人的同好社区
下载
App内打开
莱森LysonOber
11月前
✨ 做了一个 爬虫(Selenium) GPTs 助手(1.0 版本)

🤔 有时候科研人需要爬取一些网站的数据,但可能没有花太多时间系统深入学习过爬虫技术(处于一种似懂非懂的状态),这个时候如果你直接问 GPT-4,他其实很难很快给到你一个满意的回复。

🤷 首先 GPT-4 不一定会主动用 selenium 框架,面对一些反爬又很烦;其次,就算你让他使用,中间也需要大量的沟通防止 GPT-4 不要跑题(例如改着改着就不用 selenium 框架了);再者,也有人可能并不知道如何解决 ChromeDriver 的版本匹配问题,而 GPT-4 似乎很难清晰地提出这个问题的解决方案。所以我干脆就写好了 Documents 和 Prompts 方便你直接跳过很多和 GPT-4 不必要的沟通……从而迅速根据你的需求定制爬虫代码。再加上现在 GPT-4 这上下文长度起来后,不会超出限制就很好。

🐍 我把她命名为 Cyber Scraper: Seraphina。在这里可以联系她:chat.openai.com

使用的方法大致就是只要你会审查元素,然后把它们 copy 给 Seraphina,让她清楚地知道你的目标元素是啥就行。如果她没明白的话你还可以保存一下当前页面 html 文件(mac 是 cmd shift s)然后上传上去,配合着你 copy 的 element 代码,这样大致上没问题了。相比之下,直接问 GPT-4 需要花费更多的时间达成共识。

🧑‍🤝‍🧑 她也是我制作的另一个 GPTs:「Carpe Diem 教授」的朋友:chat.openai.com

🤨 那么 Seraphina 和 Carpe Diem 教授是如何认识的呢?让我们一起看看 Carpe Diem 教授是怎么说的吧 😆👇
27151

来自圈子

圈子图片

AI探索站

76368人已经加入