即刻App年轻人的同好社区
下载
App内打开
EasyPlux
2年前
自己撸了一套完全离线的RAG。

技术栈:
- llama3替代OpenAI
- nextjs做UI和api
- postgresql pgvector 做存储

中间碰到一些坑,第一个国内开发就是网络的坑,大部分框架默认自带就是OpenAI的服务,但是被墙,有的框架写的太死,都不好配置代理...

第二个坑,OpenAI默认向量纬度是1536,但是llama3是4096,得手动搞一下数据库,它默认创建的时候是1536。

还有很多配置因为ts llamaindex可能太小众了,配置啥都没有,我得去读一下源码...

学习和参考了 @艾逗笔 的两个项目,感谢!

github.com
github.com

github.com 这个项目是用langchain来写的,不过可以学习一下他的输出prompt,以及RAG的写法。

总的来说要自己搞一下,该踩的坑还得得躺。
2531

来自圈子

圈子图片

AI探索站

101331人已经加入