流媒体匹配成为ICML 2025中的超级流行话题!网民:每个人都说学习物理学的人不允许转移计算机
2025-07-19 19:41:56 | 作者: 匿名
流体力学被整合到生成的AI中,以构建一种非常简单而优雅的形式。
众所周知,第42届国际机器学习会议(ICML)将于7月13日至19日在加拿大温哥华举行。
在生成AI领域,最新的尖端热点已转向探索更高质量,更稳定,更简单,更广泛的模型形式。
流匹配技术完美地击中了每个热点元素。
由于通量模型的发布发布,可以处理多种输入类型的流匹配体系结构已成为注意力的焦点。
因此,一些学者叹了口气,认为在ICML 2025的生产相关工作中,流量匹配技术几乎无处不在。
令人惊讶的是,近年来,与物理领域相关的概念确实为生成领域的研究提供了许多新的方向和新成就。
甚至Schrdinger桥也可以用于扩散生成的领域!
生成:映射到数据的噪声
生成工作是一个逐渐的具体过程,从抽象表示,通过不同的生成网络开始,最后生成具有复杂详细信息的真实数据。在此过程中,我们希望将无序的“噪声分布”映射到不同的复杂数据分布。该映射是高度非线性的,并且具有无限的可能性。
生成猫地图从噪音到图像
本质上,流匹配的核心思想非常简单:
学会将噪声转换为数据。
我们首先选择噪声分布和数据分布之间的插值方法(如图所示)。
流匹配学习如何将每个样本沿此插值路径移动,从而在开始时间(时间0)中逐渐将噪声点转换为与结束时间(时间1)相对应的数据点。
流匹配是基于归一化流(NF)的生成模型。它通过一系列可逆变量转换逐渐将复杂的概率分布映射到简单的分布中。同时,它还可以通过这些转换的反向过程从简单分布中生成现实的数据样本。
流匹配原理:流体力学
连续性方程
那么,如何建立从噪声点到数据点的差路径?
在流体动力学和其他领域的领域已经研究了这个问题!
在流体中,很明显地跟踪每个微粒的运动轨迹。因此,我们更关心的是:每个空间区域平均存在多少水?这个平均值称为密度。
为了研究密度的变化,物理学提供了一个重要的工具:连续性方程。
连续性方程是基于一个简单而基本的原则:质量既不会出于稀薄的空气产生,也不会无缘无故地消失。
该原理不仅适用于物理质量,还适用于概率质量。这直接在生成模型中的物理概念和概率分布之间建立了直接的联系。
连续性方程式:概率质量相同
对连续性方程的直观理解:
如果流入的密度大于流出,则点的密度会增加。如果流出大于流入,则密度会降低;如果两者相等,则密度保持不变(即平衡)。
这种“总流出”称为分歧。
在物理学中,我们通常会根据颗粒的运动行为得出总体密度变化定律。
但是流匹配恰恰相反!它指定了从开始——从噪声分布到数据分布——的插值轨迹的变化密度的过程,然后学习使这种进化起作用的速度场。正是这个速度字段使我们能够从噪声中生成新的数据样本。
过程示意图
让我们从一个简单的情况开始——考虑一个数据点。
在这种情况下,我们通过从噪声点到该数据点的直线路径来定义变化过程。也就是说,在路径上的每个位置,其速度方向都直接指向目标数据点。
由于此过程是为特定数据点定义的,因此我们称其为条件流。
流匹配的“魔术”在于它如何处理整个数据分布。
在空间的任何点,都可以通过噪声和导致不同数据点开始的无数插值路径通过。目前,我们需要的总速度场是这些路径的平均方向。
训练过程的示意图(学习平均插值速度字段)和生成过程
具体原因如下:
在空间的任何点,可能会有多个路径导致与噪声不同的数据点,这可能导致概率较高或概率较低。
但是对于这个特定的位置,它更有可能在高概率样本的路径上。因此,在这个位置,通过它的所有路径的平均方向反映了这一点。
流匹配具有双重视角,称为变分流匹配(VFM)。
VFM的想法不是平均每个位置的所有路径的速度,而是推断它可能在空间中每个点的终点的分布。通过这种方式,该点的速度字段仅指向此分布的平均值。
当变异后验是高斯分布时,流量匹配等效于变化流量匹配。
我们从数据分布,噪声分布中的噪声点X_0进行采样,并在它们之间插入到某个中间点X_T。下一个流匹配学会:您应该以哪个方向移动到该位置;
相应的伪代码如下所示:
如果您对对流匹配感兴趣,则可以参考以下论文:
纸张标题:生成建模的流匹配纸链接:https://arxiv.org/abs/2210.02747
扩散和流匹配的比较
一和双方
阅读本文后,很难发现流量匹配方法与扩散模型的逻辑非常相似,并且似乎具有完全相同的正向过程。
那么扩散模型和流匹配之间的关系是什么?
MIT的副教授认为,流动匹配技术在生成模型领域的位置以及扩散模型是流量匹配的子集:
实际上,当使用高斯分布作为插值策略时,扩散模型实际上是一种特殊的流程匹配。
这是个好消息,这意味着您可以互换使用这两个框架。
关于扩散模型与流量匹配的训练过程:
重量功能的一致性:训练中使用的权重功能非常关键,这决定了模型如何平衡数据中感知到的不同频率组件的重要性。流量匹配中的重量设计与扩散模型文献中常用的训练权重功能高度一致。噪声调度对培训目标的影响很小:尽管噪声调度对训练效率有影响,但对最终训练目标功能本身的影响很小。网络输出形式的差异:流匹配提出了新的网络输出表单
扩散模型基本上等同于高斯流量匹配。
但是值得注意的是,高斯流量匹配为生成建模领域带来了两个新的模型设置:
网络输出形式:流匹配提出了一种新的网络输出参数化方法,将其视为速度字段,这与传统扩散模型中的输出形式不同。使用高级采样器时,这种形式的输出可能会导致性能差异,并可能影响训练过程中的动态行为。采样噪声调度:流匹配使用与DDIM相同的更新规则的简单采样噪声调度策略。
有关扩散模型和流匹配关联的更多信息,请参见以下文章:
文章标题:扩散符合流量匹配:同一硬币文章的两个侧面链接:https://-DiffusionFlow.github.io
参考内容:
https://x.com/feijkelboom/status/1942944767563661459
https://mlg.eng.cam.ac.uk/blog/2024/01/20/flow-matching.html
声明:本文由入驻作者编辑撰写,除官方账号外,观点仅代表作者本人,不代表本平台立场,如有侵犯您的知识产权的作品和其它问题,请与我们取得联系,我们会即时修改或删除。
相关新闻
-
中超联赛争冠组赛制解析
1. 什么是中超争冠组赛制?中超联赛争冠组赛制是指在赛季末将排名前六名的球队组成一组,进行一轮单循环的比赛,获胜积分最高的球队将荣膺该赛季的中超冠军。2. 中超争冠组赛制的优点是什么?首先,中超争冠组赛制缩小了争冠球队之......
-
巴塞罗那vs巴黎圣日耳曼6比1回放,巴塞罗那vs巴黎圣日耳曼6比1全场视频
1. 赛前阵容分析巴塞罗那和巴黎圣日耳曼各自派出了最强阵容参加这场比赛。巴塞罗那的梅西、苏亚雷斯和内马尔以及巴黎圣日耳曼的博格巴、迪马利亚和卡瓦尼都是顶尖球星,他们的发挥将直接影响比赛。2. 巴塞罗那的控球优势巴塞罗那在......
24小时热文
-
puma足球鞋,Puma足球鞋mg106673-02
2023-10-15
-
1993年NBA总决赛数据纪念经典时刻,回顾传奇巨星们的辉煌岁月
2024-01-12
-
介绍2010年NBA总决赛黑哨内幕,让你看清现实世界的阴暗面
2023-12-18
-
如何成为NBA真球迷?WinFuture广告告诉你答案
2024-03-18
-
nba球员效率值如何查询?
2023-11-07
-
NBA2K17热火队精彩比赛集锦
2024-01-30
用户评论
哇,流媒体匹配在ICML 2025上这么火啊!我之前就对这个领域挺感兴趣的,感觉这次大会肯定会有很多新发现。
有10位网友表示赞同!
哈哈,每个人都说学习物理学的人不允许转移计算机,这听起来好有趣。不知道他们是怎么看待流媒体匹配的。
有6位网友表示赞同!
流媒体匹配能成为超级流行话题,说明这个技术真的有潜力啊!我得赶紧去研究研究。
有5位网友表示赞同!
每次看到这种话题,我都觉得学习物理学的人是不是都被逼着转行到计算机科学了?这不太公平吧。
有7位网友表示赞同!
流媒体匹配在ICML 2025这么火,说明人工智能领域又向前迈了一大步!期待看到更多创新。
有20位网友表示赞同!
每个人都说学习物理学的人不允许转移计算机,这让我有点好奇,他们是不是真的不能转呢?
有15位网友表示赞同!
流媒体匹配成为热门话题,看来我得重新审视一下我的专业方向了。或许物理学和计算机科学结合会有新天地。
有20位网友表示赞同!
这个标题听起来好有深度,我一定要去ICML 2025现场看看,看看流媒体匹配到底有多厉害。
有20位网友表示赞同!
学习物理学的人不允许转移计算机?这说法也太夸张了吧,我觉得很多物理学家对计算机科学也很感兴趣。
有6位网友表示赞同!
流媒体匹配成为超级流行话题,看来我错过了一场盛宴。希望以后有机会能深入了解。
有13位网友表示赞同!
每次看到这种标题,我都觉得计算机科学和物理学越来越近了,这让我对未来的科技发展充满期待。
有16位网友表示赞同!
流媒体匹配成为ICML 2025的焦点,这让我想起了大学时的编程课,那时候对计算机科学充满了热情。
有13位网友表示赞同!
每个人都说学习物理学的人不允许转移计算机,我觉得这可能是对物理学家的误解吧。他们完全可以跨学科发展。
有5位网友表示赞同!
流媒体匹配在ICML 2025这么火,说明人工智能和流媒体行业都有很大的发展空间。我得好好跟进一下。
有6位网友表示赞同!
我对流媒体匹配这个话题很感兴趣,但是学习物理学的人不允许转移计算机这个说法,我觉得有待商榷。
有10位网友表示赞同!
流媒体匹配成为超级流行话题,看来我得赶紧更新我的知识库了。毕竟,时代在变,我们也要跟上。
有12位网友表示赞同!
这个标题让我想起了我在大学时的梦想,那时候就想将物理学和计算机科学结合起来。现在看,这个梦想可能离我更近了。
有12位网友表示赞同!
流媒体匹配成为ICML 2025的焦点,这让我对未来的流媒体行业充满了期待。希望有一天能亲自参与到这个领域中去。
有19位网友表示赞同!