即刻App年轻人的同好社区
下载
App内打开
punky
536关注3k被关注0夸夸
有朋自远方来,尚能饭否?
punky
2天前
这篇介绍 Optimal Transport / Wasserstein Distance (挖土 distance) 的文章不错

A Short Introduction to Optimal Transport and Wasserstein Distance · Its Neuronal

00
punky
21天前
来源于真实对话
90
punky
21天前
李宏毅的这个视频对于理解 Linear Attention 还是挺有帮助的,对于历史和动机介绍得很充分。youtu.be
00
punky
3月前
微信现在的浮窗功能很不好用,尤其在满 5 个之后想添加新的需要关掉某个老的时候,缩略图看不清,放大了又不能直接取消浮窗,得来回缩放定位😑(通常一怒之下全关了)
20
punky
5月前
暑假作业有个填空题:暑假你做过最勇敢的事情____,孩子第一天就完成了任务,“下午没做作业,惹妈妈生气”😵‍💫
11
punky
7月前
介绍 KV cache,一图胜千言(文章里的第二张动图,这里粘贴不上来,太大)

https://medium.com/@joaolages/kv-caching-explained-276520203249

01
punky
7月前
有点东西🤔
111
punky
7月前
对于想要大概了解 Flow Matching 的童鞋,推荐 MIT 的这门小课 diffusion.csail.mit.edu,对于核心概念讲解清晰且符合物理直觉。flow matching 的原理我感觉比 diffusion 更易理解(而且还SOTA :D)。讲一下我从小白视角的理解:
文生图(无 condition)的过程,我们可以理解成是从一个纯随机的正态分布采样一个点,逐渐把它变成很“真”的一张图片。diffusion 是逐渐把采样到的这个“白噪音”点不断“去噪”,变成一张图片。而 flow matching,是让一个“磁场”去推着这个点不断移动,最终“移动”变成一张图片(想象图片 vector 各个维度的数值有加有减不断变化)。
稍微展开来说,flow matching 本质上是在学习一个 vector field/向量场(一个vector field定义一个ODE),可以把它想象成一个磁场。一开始我们只有一个符合正态分布的“沙堆”,我们的目标是逐渐”推移“这个沙堆,让它最终的分布符合我们要的分布(真实世界的图片)。对于每粒沙子在每个时间点、每个位置,磁场力的方向(往哪个方向推)就是我们要 neural network 学习的东西。一粒沙子从初始位置到目标位置”被磁场推着“经过的路,就是一个 flow(ODE 的一个解),不同沙子走出了多条 flow 形成多个训练数据不断调教 NN 去学习磁场里的方向,大量平均下来就是我们想要的磁场/模型。
细心的童鞋可能会问,那 NN 咋知道往哪推啊?给定了一张图片,对于”想要成为它的沙子“,在一个时间点和一个位置,我们磁场力的方向是提前设计好的(conditional vector field),这样 NN 对于一个样本往哪推是知道的。我们不知道的是大量这样的数据,最终让 NN 平均下来会学成个啥样,即 marginal vector field(就是我们想要的)。
最后附几张作业截图证明我不是瞎吹牛(btw 作业很简单)
21
punky
9月前
推荐一个形象理解 MLA 的宝藏视频,youtu.be。重点理解矩阵吸收,图一是吸收前,图二是吸收后(图三红圈标出来的就是等价替换的矩阵乘法,一个“吸”在前面了,一个“吸”在后面了)
00
punky
9月前
什么叫文化“入侵”,我小时候掉了牙不是往房顶上扔就是往土里埋(根据上下牙),现在的孩子掉了牙想的是睡觉的时候把牙藏在枕头底下,等着牙仙子来换成金币😂
30