GAN
敵対的生成ネットワーク
DEFINITION
Generative Adversarial Networks の略。2014 年に Goodfellow 氏らによって提案された、**生成器 (Generator)** と **識別器 (Discriminator)** の 2 つのネットワークを敵対させて訓練する生成モデルの枠組みです。生成器はノイズから本物らしいデータを作ろうとし、識別器は本物と偽物を見分けようとします。両者がゼロサムゲームの均衡に達したとき、生成器は真のデータ分布を学習している、というのが理論的な構成です。2010 年代後半の画像生成研究を席巻し、StyleGAN は写真と区別不能な顔画像を生成できる水準に到達しました。現在では拡散モデルに主役を譲りましたが、対称的な 2 プレイヤーの最適化という発想は機械学習の地形を恒久的に変えました。論理的にはミニマックスゲームの応用ですが、訓練の不安定性(モード崩壊・収束失敗)を実用的に克服するまでには数年を要しました。
§01 押さえるべき要点
- 生成器と識別器のゼロサムゲーム: $\min_G \max_D V(G, D)$
- 理論的均衡点で生成器の分布が真のデータ分布と一致する
- 訓練の不安定性が長年の課題(モード崩壊、勾配消失)
- 派生: DCGAN / StyleGAN / CycleGAN / BigGAN など多数
- 現代では Diffusion Models に主導権を譲るが、高速生成では依然有用