即刻App年轻人的同好社区
下载
App内打开
范青的AI工坊
1关注0被关注0夸夸
🎓 在校生,用一张3060搭了两个AI模型 | 追求极致长上下文和防复读 | 非商业,只摊电费 | 欢迎来薅|🔗 源码开源,见置顶动态
置顶
范青的AI工坊
5天前
🚀 端午打算让我的 3060 显卡连跑 72 小时 AI 服务
🧠 模型:Gemma 12B(精准日常) + 20B(超长上下文 16384)
⚡ 速度 70+ tok/s,成本价 1 元/天,纯粹摊电费
🔗 部署源码已开源:github.com
🙋 想参与测试的朋友,评论区留个“求测试”,我私信发 Key~
#独立开发的日常 #AI工作流
10
范青的AI工坊
1天前
端午 72 小时 AI 测试,倒计时 1 天。

即刻上没找到测试的人,但服务会照常跑。
一张 3060,两个模型,16384 上下文,71 tok/s。

6.19 - 6.21,全程记录性能数据和对话案例,测试报告开源在 GitHub。
如果临时想围观或测试,随时留言,我看到就回。

🔗 源码及后续报告:github.com
#独立开发的日常 #AI工作流
00
范青的AI工坊
2天前
坦诚说,前几条帖子没什么人看,可能是我不会写推广文案。

但东西是真的:一张 RTX 3060 显卡,两个模型,16384 上下文,71 tok/s。为了端午测试能稳定跑 72 小时,我调试了好几周——显存爆过、缓存格式选错过、半夜自动关机也查过。

现在终于稳了,端午(6.19-6.21)准备正式跑。

三个套餐,只摊电费:
① 留言“求测试”,免费领 500 Tokens
② 0.99 元/天,全模型畅玩
③ 2.99 元,端午畅玩包(10 万 Tokens)

源码全在 GitHub:github.com

就当支持一下学生项目吧。
#独立开发的日常 #AI工作流
10
范青的AI工坊
3天前
倒计时 4 天。
你们平时用 AI 最多的场景是什么?
写文案?翻译?写代码?还是写小说?
我端午准备测试两个模型:Gemma 12B(精准日常)和 20B 长文模型(16384 上下文),应该能覆盖这些场景。
源码已开源:github.com
🎁 端午统一发 Key,现在留言“求测试”预约,或者直接告诉我你的答案~
#独立开发的日常 #AI工作流
00
范青的AI工坊
5天前
端午打算让宿舍里的 RTX 3060 连跑 72 小时 AI 服务。

一张显卡塞了两个模型:

· Gemma 12B:日常问答,回答严谨不胡说
· 20B 长文模型:16384 上下文,生成 71 tok/s

全依赖 Flash Attention 和 Q8_0 缓存优化,把显存压到极限才跑出来。

成本就一张卡钱,端午测试只摊电费:
① 留言“求测试”,免费领 500 Tokens
② 0.99 元/天,全模型畅玩
③ 2.99 元,端午畅玩包

源码已开源:github.com

⚠️ 端午当天(6.19)统一开机发 Key,现在先预约占坑~
#独立开发的日常 #AI工作流
10
范青的AI工坊
6天前
来到即刻的第一天。
00