生成モデルの主要カテゴリ
Table of Contents
主要な分類
1. 尤度ベースモデル(explicit densityモデル)
- Autoregressiveモデル:PixelCNN、PixelRNN、GPT、BERT
- Variational Autoencoders(VAE):標準VAE、β-VAE、VQ-VAE
- Flowベースモデル:RealNVP、Glow、NICE
- エネルギーベースモデル(EBM):Restricted Boltzmann Machines
- Diffusionモデル:DDPM、Score-basedモデル
2. 暗黙的生成モデル(explicit densityなし)
- Generative Adversarial Networks(GAN):DCGAN、StyleGAN、Progressive GAN、Conditional GAN
主な違い
- 尤度ベース:明示的な確率分布$p(x|\theta)$を定義し、尤度を計算可能
- 暗黙的:明示的な密度関数を定義せずに直接サンプルを生成
一部のモデルはこれらのカテゴリを曖昧にします:
- Diffusionモデルは尤度ベースですが、反復的なdenoisingプロセスを通じてサンプルを生成します
- Score-basedモデルは密度自体ではなく、対数密度の勾配を学習します
各アプローチには以下の点でトレードオフがあります:
- トレーニングの安定性
- サンプル品質
- 尤度計算
- 生成速度
- モードカバレッジ