即刻App
年轻人的同好社区
下载
App内打开
壳壳
312
关注
279
被关注
0
夸夸
程序猿👨💻/主机游戏🎮/想做音乐🎵
🌟不以物喜,不以己悲
🐙NS🆔 SW-5813-6666-3789
置顶
壳壳
4月前
野排终于600分
15
10
0
壳壳
20天前
👏
Simon的白日梦: GitHub - CrazyBoyM/llama3-Chinese-chat: Llama3 中文版 首个llama3中文微调版来咯~!🥹 🧐llama3-Chinese-chat项目是一个开源的中文聊天模型,基于Llama3框架,旨在提供高质量的中文NLP任务处理能力。 ➡️链接:https://github.com/CrazyBoyM/llama3-Chinese-chat ✨重点 ●📚 项目整合了多种中文NLP任务的数据集,包括对联、作诗、文言文翻译、散文、金庸小说等,用于训练和提高模型的中文处理能力。 ●🔧 提供了丰富的技术文档和视频教程,帮助用户了解模型的部署和推理过程。 ●👥 项目支持社区交流,设有专门的QQ群和B站账号,便于用户进行交流和学习。 ●💾 模型支持多种格式的下载和使用,包括基本的预训练模型和针对特定任务微调的模型。 ●🖥️ 提供了多个实用工具库的推荐,方便用户对自己的Llama3中文模型进行定制和优化。 ●🌐 项目代码遵循MIT许可证,鼓励开源社区的贡献和发展。
0
0
0
壳壳
21天前
真的假的🤨?
1
0
0
壳壳
23天前
搞了张jcb,终于可以绑定到eshop了😂
6
7
0
壳壳
1月前
💪
Omphalos: 看到这个😂然后去查了一下affine,真的太强了! 我感觉基本可以替代notion了,除了notion AI 官网在 https://affine.pro
0
0
0
壳壳
1月前
awesome🤯
歸藏: EasyContext 这个项目展示了如何将现有的技术组合应用,训练700K和1M上下文的语言模型。 在训练过程中并没有使用任何近似处理手段。 这些模型可以经历完整的微调,应用完整的注意力机制,并处理完整的序列长度。训练脚本代码不足200行。 运用了以下技术: 序列并行技术。 Deepspeed zero3 的内存卸载技术。 Flash 注意力机制及其结合的交叉熵核心技术。 激活状态的检查点技术。 持两种不同的序列并行处理方法: 环形注意力机制 分布式 Flash 注意力机制 模型仅在512K的序列长度上进行训练,但能够在接近100万Token的上下文中实现良好的泛化。 项目地址:https://github.com/jzhang38/EasyContext
1
0
0
壳壳
2月前
DBRX量化之后甚至可以在Apple Silicon上运行,也是挺惊讶的
3
0
0
壳壳
2月前
只有三麻才能让我快乐😎
4
0
0
壳壳
2月前
【AI原创音乐】夏の交響曲(SunoV3)
词:GPT4/Gemini
曲和唱:Suno
封面:DALLE 3
字幕:Whisper
风格:j-pop
EQ:OZone
02:57
3
0
0
壳壳
2月前
😭
吴宽宽: 七年了 是谁还没走出来啊🥺
3
0
0
壳壳
2月前
大剑侠专属音♂效mod(内含哲学烂梗,不喜慎点
00:30
9
0
0