G検定の学習を進めていて、L1正則化に続いて登場する「L2正則化(リッジ回帰)」に頭を悩ませていませんか?
「重みの二乗和をペナルティとして加える」なんてテキストに書かれていても、数式だけでは「結局、L1と何が違うの?」と混乱してしまいますよね。
L2正則化は、ディープラーニングの「重み減衰(Weight Decay)」の正体でもあり、過学習を防ぐために欠かせない超重要技術です。
そこで今回は、L2正則化の仕組みを「直観編」と「理論編」の2つのステップで、どこよりも分かりやすく図解します!
1. 【直観編】L2正則化を一言でいうと?
L2正則化を一言でいうと、「誰もクビにしない!全員でちょっとずつ荷物を減らす連帯責任」です。
前回の記事で解説した「L1正則化」と比較しながら、イメージを掴んでいきましょう。

- L1正則化(お片付け): 価値の低いヒントを見つけて、完全に「ゼロ(消去)」にします。すっきり身軽になりますが、極端に切り捨てすぎてしまうこともあります。
- L2正則化(連帯責任): 誰もゼロ(クビ)にはしません!全体の数値を「ちょっとずつ」小さくします。ヒントの個数は減りませんが、突出したお荷物(暴走データ)が消えて一番安定します。
誰も見捨てず、チーム全体のバランスを最強に安定させるアプローチ。これがL2正則化の大きな特徴です。
2. 【理論編】数式の裏側で起きていること
では、数式の裏側(理論)ではどのようにして数値をコントロールしているのでしょうか? L2正則化の計算の仕組みを見てみましょう。
こちらの図解を見てください。

L2正則化の正体は、「重みの『二乗の合計』にペナルティを与え、特定のデータの暴走を防ぐ技術」です。
重みを「二乗」した値の合計を計算するため、数値が突出して大きい重みほど、超強力なペナルティ(罰点)を受けるルールになっています。
このルールによって、異常に大きな数値を最優先でジワジワと小さく抑え込みます。 数値は完全な0にはなりませんが、全体がマイルドに均一化されるため、過学習(大ハズレ)に対して最も強い耐性を持つことができるのです。
3. まとめ:L1とL2の使い分け
今回は、L2正則化の仕組みについて解説しました。
重要なポイントをまとめます。
- L2正則化とは、重みの二乗和にペナルティを与えて数値をマイルドに抑え込む技術
- 誰もクビ(ゼロ)にせず、全員で均等に縮むことでチームのバランスを保つ
- すべての点で綺麗に微分できるため、数式的な扱いやすさは抜群
これで、過学習を防ぐ2大ブレーキである「L1」と「L2」の仕組みがどちらも線で繋がったはずです。
お互いの特徴をしっかり整理して、G検定の得点源にしていきましょう!



コメント