坦诚说,前几条帖子没什么人看,可能是我不会写推广文案。
但东西是真的:一张 RTX 3060 显卡,两个模型,16384 上下文,71 tok/s。为了端午测试能稳定跑 72 小时,我调试了好几周——显存爆过、缓存格式选错过、半夜自动关机也查过。
现在终于稳了,端午(6.19-6.21)准备正式跑。
三个套餐,只摊电费:
① 留言“求测试”,免费领 500 Tokens
② 0.99 元/天,全模型畅玩
③ 2.99 元,端午畅玩包(10 万 Tokens)
源码全在 GitHub:
github.com就当支持一下学生项目吧。
#独立开发的日常 #AI工作流