即刻App年轻人的同好社区
下载
App内打开
不在场阿外
1天前
运营要学AI 技术名词!

2025 年,因为参与过 AI IM 软件落地的讨论,也对接同款模型,更是处理过些AIGC的 badcase,我特意用 AI 学习了蛮多名词,比如 BERT、CLIP、Multi-Head Attention、多模态、上下文、向量、鲁棒性等,也了解业界算法能力可以基本做到什么水平,方便和产品、技术沟通时候有的放矢(装个大的)。

今天汇总下近期有在关注的一些概念或者技术名词。

1、Infra (Infrastructure - 基础架构)
Infra 指的是支撑大模型训练和推理的所有底层设施。
大模型对计算资源要求很高,Infra的优劣可以决定大模型的水平
👉通俗理解: 如果大模型是一个大厨,Infra 就是厨房设备。炉灶猛不猛、冰箱大不大、食材供应链稳不稳定。没有它,再牛的大厨也开不了火。

2、预训练 (Pre-training) & RL (Reinforcement Learning - 强化学习)
传统的预训练 (Pre-training)是通过海量阅读,让大模型成为懂王。
👉通俗理解:预训练是大厨基本功。他读过万本菜谱,背下了所有食材的味道。什么都会做,但没有个人风格。

RL 是通过奖励机制来训练模型的,比如模型给出几个答案,人类(或者另一个评价模型)给这些答案打分。表现好的答案会被奖励,模型以后就会多这么说话。
👉通俗理解:强化学习就是食客的反馈。客人说太咸就少放盐,说摆盘好看就保持。通过这种反馈-奖励机制,大厨才练出了招牌菜,懂得了如何讨人喜欢。

Infra 是硬实力(地基),预训练 是长见识(学识),RL 是练情商(对齐人类)。

2025 年被称为 RL 元年,因为DeepSeek R1 R 就是 RL的 R(我说的哈哈哈后半句 方便理解啦,其实是Reasoning 推理啦,不过也要有强化学习才能推理呀!

昨天的📝
01

来自圈子

圈子图片

一起来学习

133979人已经加入