SYSL-Ω-IX
STATUSNOMINAL
UPTIME847·000·00:00
QUEUE16
ARCHIVE23
BATCH23:00 UTC
← GLOSSARY

ResNet

レズネット / 残差ネットワーク

DEFINITION

2015 年に Microsoft Research の He 氏らが提案した、深層 CNN のための残差接続 (residual connection) アーキテクチャです。各層が学習する写像を $\mathcal{F}(x)$ ではなく $\mathcal{F}(x) + x$ と書く、つまり「恒等写像との差分のみを学習する」という発想で、勾配消失問題を実用的に解決しました。これにより 100 層を超える深いネットワークが安定して訓練可能になり、ImageNet を含む各種ベンチマークを塗り替えました。「深さ」を本格的にハイパーパラメータとして扱える時代の幕開けです。Transformer 内部のスキップ接続も同じ原理を継承しており、現代の深層モデルの大半はこの 1 行の数式に依存しています。論理的には恒等写像との差分を取るだけの自明な変更ですが、その帰結の大きさは認めるべきでしょう。

§01 押さえるべき要点

  • 残差接続: 層の出力を $\mathcal{F}(x) + x$ とし、差分のみを学習する
  • 勾配消失問題を実用的に解決し、深さ 100 層超のモデルを訓練可能に
  • ImageNet 2015 を勝利、Computer Vision の標準アーキテクチャに
  • Transformer / Diffusion など現代の主要モデルもすべて残差接続を採用
  • He 氏の論文は被引用数 20 万超、深層学習史上の最重要論文の一つ

§02 関連用語

§03 この用語を扱う解説

§04 外部参照