即刻App年轻人的同好社区
下载
App内打开
雅芳af
5月前
👩‍💻回顾今年,AI大模型开发者关注的技术要点可以归纳为以下几个主题,汇总了每个主题涵盖的一些开发者关心的问题,以及相关的技术文章和论文,分享出来

▶️大型语言模型(LLM)微调
▶️垂直领域模型微调
▶️LLM+外挂知识库
▶️LLM+Agent
▶️长文本微调
▶️多模态大型语言模型
▶️国内外高性能开源基座
▶️OpenAI官方发布的一些技术文档

1️⃣大型语言模型(LLM)微调
✅大语言模型从入门到精通
🔗大模型技术基础教材:intro-llm.github.io
🔗大模型技术实战:wangwei1237.github.io
✅微调指令数据集构造
🔗通过self instruct的方式让GPT-4生成大量的指令和回复的数据对
🔗开源指令集汇总:github.com
✅低资源下,微调大模型选择的技术路线
🔗参数高效微调方法(PEFT,如lora、prefix tuning等):www.zhihu.com
🔗Huggface开源的高效微调大模型的库:huggingface.co
🔗QLoRA和全量参数微调Llama/Baichuan等:github.com
✅微调、推理大模型所需的显存计算
🔗大模型显存估计开源工具:huggingface.co
🔗大语言模型LLM推理及训练显存计算方法:www.cnblogs.com
✅微调、推理、量化常见使用的开源框架
🔗常见微调框架:llama-factory、deepspeed、metronlm、unsloth
🔗常见推理加速框架:vllm、mlc-llm、Medusa
🔗常见量化框架:exllamav2、bitsandbytes
✅大语言模型幻觉相关的论文:
🔗幻觉定义、解决思路github.com
✅符尧老师关于数据工程、大模型评测文章:
🔗包含预训练阶段如何找到「最优的混合比例+数据格式+数据课程」来使学习速度最大化等
yaofu.notion.site
🔗关于大模型评测:yaofu.notion.site

2️⃣垂直领域模型微调
✅领域主流模型:
教育(如educat)、医疗(如ChatGLM-Med)、金融(如FinLLM)、心理(MindChat)、法律(ChatLaw)、科学(starwhisper)等
✅开源、高质量的预训练语料
🔗悟道data.baai.ac.cn
✅领域:专用数据集配比如何
🔗Chathome数据配比,介于1:5~1:10之间

3️⃣LLM+外挂知识库
✅知识库构建流程
🔗从 RAG 到 Self-RAG zhuanlan.zhihu.com
✅实现rag的开源项目,
🔗langchain、llamaindex baoyu.io
✅大模型外挂知识库(RAG)优化方案
🔗www.zhihu.com

4️⃣LLM+Agent
✅OpenAI应用研究主管的万字长文
🔗Agent = LLM+ 记忆 + 规划技能 + 工具使用:juejin.cn
✅Agent当前的研究重心
🔗如何选择基础模型、prompt设计上有哪些参考的示例:ReACT(react-lm.github.io)、ReWOO(arxiv.org
✅Agent有哪些常见的主流开源框架
Autogen、AutoGPT、BabyAGI等

5⃣️长文本微调
✅长文外推能力的定义
🔗苏剑林老师:spaces.ac.cn
✅主流模型使用的外推技术
🔗旋转位置编码RoPE zhuanlan.zhihu.com
✅长文微调的流程和训练代码
🔗单卡高效扩展LLaMA2-13B上下文: github.com
✅长文本压测
🔗Kimi Chat 公布“大海捞针”长文本压测结果 mp.weixin.qq.com
✅100k上下文的工程与数据基础方案
🔗From 符尧 100k 可以通过暴力工程实现,不需要 fancy 的架构改变 yaofu.notion.site

6️⃣多模态大型语言模型
✅多模态和多模态大模型(LMM)
🔗全面介绍多模态系统,包括LMM baoyu.io
✅多模态有哪些主流的开源模型
fuyu-8b、llava、mPLUG-Owl2、Qwen-VL
✅多模态大型语言模型微调
🔗数据集构造、微调、评测 zhuanlan.zhihu.com

7⃣️国内外有哪些优质开源基座
✅llama1/2、phi-1/phi-1.5/phi-2、Mistral 7B、Orca2
✅qwen(7/14/72B)、baichuan1/2、yi(6/34B)
✅intenlm、tigerbot1/2、skywork

8️⃣OpenAI官方发布的一些技术文档
✅【中文版】OpenAI官方提示工程指南
baoyu.io
✅OpenAI 微调文档
platform.openai.com
✅OpenAI 安全对齐研究、超级对齐计划
openai.com
openai.com
520

来自圈子

圈子图片

AI探索站

67176人已经加入