DDPM vs. スコアベースモデル | tsuji.tech

Table of Contents

主な違い

DDPM (Denoising Diffusion Probabilistic Models):

フレームワーク：離散時間マルコフ連鎖
学習：各タイムステップで追加されたノイズ$\epsilon$を予測
目的関数：変分下限（ELBO）
プロセス：固定された順方向プロセスがガウシアンノイズを追加し、逆方向プロセスを学習
式：$|\epsilon - \epsilon_\theta(x_t, t)|^2$を最小化

スコアベースモデル:

フレームワーク：連続時間Diffusion（SDE）
学習：スコア関数$\nabla_x \log p(x)$（対数密度の勾配）を予測
目的関数：スコアマッチング（デノイジングスコアマッチング）
プロセス：複数のスケールでノイズを追加し、各ノイズレベルでスコアを学習
式：$|\nabla_x \log p(x_t) - s_\theta(x_t, t)|^2$を最小化

関連性

これらは本質的に同等です！Song et al. (2021)は以下を示しました：

DDPMのノイズ予測$\epsilon_\theta$はスコアと関連しています：$s_\theta(x_t, t) = -\frac{\epsilon_\theta(x_t, t)}{\sqrt{1-\bar{\alpha}_t}}$
Score-Based Modelは連続時間（離散ステップの代わりにSDE）を使用することでDDPMを一般化します
両者は異なるパラメータ化を通じて同じ基本構造を学習します

Score-Basedの視点は、より柔軟性を提供します（連続時間、異なるノイズスケジュール、確率フローODEなどの代替サンプラー）。