M'AI: Continuous networks 1000-1M26CN
Przedmiot poświęcony jest nowoczesnym metodom uczenia maszynowego opartym na modelach ciągłych, stanowiących jedno z najbardziej dynamicznie rozwijających się podejść współczesnej sztucznej inteligencji. Szczególny nacisk zostanie położony na continuous-depth neural networks, neural ordinary differential equations (Neural ODEs), physics-informed neural networks (PINNs), neural operators oraz modele dynamiczne wykorzystywane w scientific machine learning.
W przeciwieństwie do klasycznych architektur głębokiego uczenia, opartych na skończonej liczbie warstw, continuous neural networks interpretują proces propagacji informacji jako ewolucję ciągłą opisywaną równaniami różniczkowymi. Takie podejście pozwala na wykorzystanie narzędzi analizy matematycznej, teorii układów dynamicznych oraz metod numerycznych do badania własności modeli neuronowych, ich stabilności, zdolności generalizacji i interpretowalności.
Celem kursu jest przedstawienie matematycznych podstaw ciągłych modeli neuronowych oraz pokazanie ich związków z równaniami różniczkowymi zwyczajnymi i cząstkowymi, teorią sterowania, optymalizacją oraz analizą numeryczną. Studenci poznają zarówno aspekty teoretyczne, jak i praktyczne związane z implementacją nowoczesnych modeli continuous-time deep learning.
Istotnym elementem kursu będzie interpretacja popularnych architektur głębokiego uczenia — takich jak ResNet — jako dyskretyzacji równań różniczkowych, co prowadzi naturalnie do modeli typu Neural ODE. Omówione zostaną również metody continuous backpropagation, adjoint methods oraz zagadnienia związane ze stabilnością i efektywnością obliczeniową modeli ciągłych.
Kurs łączy ścisłe podejście matematyczne z praktycznymi aspektami implementacji, pokazując jak współczesna matematyka staje się językiem sztucznej inteligencji.
Forma zajęć:
Wykłady: ogólne wprowadzenie teoretyczne; Ćwiczenia: analityczne podejście do NN, Planowane są również kilkudniowe warsztaty wyjazdowe (poza Warszawą, w zależności od dostępności środków).
Koordynatorzy przedmiotu
Założenia (opisowo)
Kryteria oceniania
Projekt zaliczeniowy plus prezentacja.
Literatura
Ian Goodfellow, Yoshua Bengio, Aaron Courville, Deep Learning, MIT Press, Cambridge, 2016.
Chen T.Q. i wsp. (2018) "Neural Ordinary Differential Equations"
Dupont E. i wsp. (2019) "Augmented Neural ODEs"
Vladimir I. Arnold, Ordinary Differential Equations, Springer, 1992.
Więcej informacji
Więcej informacji o poziomie przedmiotu, roku studiów (i/lub semestrze) w którym się odbywa, o rodzaju i liczbie godzin zajęć - szukaj w planach studiów odpowiednich programów. Ten przedmiot jest związany z programami: