こんにちは! AI技術の「なぜ?」を解き明かす、現役インフラエンジニアのコシです。 前回は、Transformerの内部でSelf-Attentionの後に配置される「Feed-Forward Network(FFN)」について解説しました。 FFNが、Self-Attentionによって得られた文脈情報を、より高次の特徴 ...
序章:AIの「絶対的な常識」に突きつけられた挑戦状 深層学習、特に自然言語処理や画像認識の分野で革命を起こしたTransformerアーキテクチャ。その成功の裏には、Normalization(正規化)レイヤー、とりわけ**Layer Normalization (LN)**の存在が不可欠とされてきました ...