GPTs已经上线两个多月了,但我发现大多数制作GPTs的人对其中的「Knowledge」能力都有相当大的误解和错用:
1、许多类型的文件都可以上传到Knowledge,比如图片文件(jpg、png)、音视频文件(mp3、mov)、书籍格式文件(epub、mobi)、数据文件(csv、xlsx)、文本文件(md)等都可以,但以上所列文件上传后都不会作为所谓的「资料库」索引,而是可以用来在代码解释器中被加工,比如你要压缩转换图片格式,或者分析数据,这些文件上传后会被提示“The following files are only available for Code Interpreter”。
2、pdf、doc等少量文本文件会被作为「资料库」索引,检索方式是RAG(Retrieval-Augmented Generation),在这种情况下适合实现的能力是让他帮你检索相关知识,比如客服机器人、或者个人分身助理等;但是很多人会期望在其中投喂文章素材,让GPTs学习文章写作技巧去生成文本,这是需要通过微调(finetunning)才可以的,或者你干脆直接在instructions多放些示例,通过Knowledge形式是做不到的。