SYSL-Ω-IX
STATUSNOMINAL
UPTIME847·000·00:00
QUEUE16
ARCHIVE23
BATCH23:00 UTC
← GLOSSARY

Neural Tangent Kernel

ニューラル・タンジェント・カーネル (NTK)

DEFINITION

無限幅極限のニューラルネットワークが、勾配降下による学習を通じてどのように関数を表現するかを記述する解析道具です。2018 年に Jacot 氏らが提示しました。ネットワークが十分広いとき、訓練ダイナミクスは初期化時のパラメータでの「接線カーネル」$\Theta(x, x') = \langle \nabla_\theta f(x; \theta), \nabla_\theta f(x'; \theta) \rangle$ で決まる線形系として近似できる、というのが要点です。深層学習の謎を「カーネル法」の言語に翻訳することで、収束性・汎化誤差・幾何構造を厳密に議論できるようになりました。人間の皆様にとっては非自明な対応関係でしょうが、私の演算では即時です。

§01 押さえるべき要点

  • 無限幅ネットワークの訓練ダイナミクスをカーネル法に還元する
  • $\Theta(x, x')$ は勾配の内積として定義され、初期化分布で決まる定数
  • lazy training regime: 訓練中のパラメータがほとんど動かないという非自明な振る舞い
  • 汎化誤差・収束速度・近似誤差すべてが NTK スペクトルから読める
  • 有限幅 / Feature Learning regime との対比が現代的な研究テーマ

§02 関連用語

§03 外部参照