- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Uczenie maszynowe w modelowaniu i projektowaniu biomolekuł 1200-UMPB-OG
1. Podstawy uczenia maszynowego
1.1 Metody uczenia maszynowego; architektury sieci neuronowych; kodowanie danych; uczenie i walidacja.
1.2 Zastosowania w modelowaniu biomolekularnym i odkrywaniu leków.
1.3 Wprowadzenie do reprezentacji białek, ligandów i związków chemicznych. Opis formatów danych, takich jak SMILES, PDB i FASTA
1.4 Podstawy chemoinformatyki; modele opisujące związki chemiczne, obliczanie właściwości molekularnych.
demonstracja: Użycie biblioteki RDKit w Pythonie do parsowania SMILES i konwersji do grafu molekularnego.
Wizualizacja struktury i obliczanie podstawowych właściwości, takich jak masa cząsteczkowa, liczba wiązań wodorowych i
polarność.
2. Uczenie maszynowe w modelowaniu biomolekularnym
2.1 Proste modele klasyfikacji i regresji; przewidywanie wiązań ligandów z białkami
2.2 Sieci o rozbudowanej architekturze: modele konwolucyjne i rekurencyjne, sieci grafowe
demonstracja: wykorzystanie biblioteki pytorch do
przewidywania wiązania małych cząsteczek do cytochromu CYP1A2
3. Generatywne sieci neuronowe
3.1 Wprowadzenie teoretyczne do generatywnych sieci neuronowych i ich zastosowanie w modelowaniu molekularnym.
3.2 Generowanie nowych cząsteczek chemicznych, optymalizacja właściwości leków i analiza przestrzeni chemicznej
3.3 Przykłady generowania związków chemicznych i białek przy użyciu modeli warunkowych (cVAEs).
demonstracja: użycie cVAE do generowania nowych cząsteczek z przestrzeni ukierunkowanej na właściwości, takie jak toksyczność lub farmakokinetyka.
4. Projektowanie białek za pomocą ML
4.1 Koncepcje projektowania białek, w tym de novo design, modyfikacje sekwencji oraz aplikacje praktyczne.
4.2 Wykorzystanie generatywnych metod ML w kontekście generowania nowych sekwencji i struktur białek.
4.3 Metody maszynowe wykorzystywane w projektowaniu białek: RFDiffusion, AlphaFold, Protein MPNN
demonstracja: zaprojektowanie białka globularnego przy wykorzystaniu istniejących modeli (dostępnych online)
Rodzaj przedmiotu
Tryb prowadzenia
mieszany: w sali i zdalnie
Założenia (opisowo)
Koordynatorzy przedmiotu
Efekty kształcenia
Student rozumie:
- podstawowe koncepcje uczenia maszynowego oraz ich zastosowanie w modelowaniu biomolekularnym i odkrywaniu leków.
- działanie sieci neuronowych oraz różnice pomiędzy podstawowymi architekturami
Student umie:
- analizować i przetwarzać dane biomolekularne, w tym reprezentacje białek i cząsteczek chemicznych
- krytycznie ocenić zastosowanie uczenia maszynowego w biomedycynie, uwzględniając etyczne wyzwania i ograniczenia technologii
- projektować białka de novo, optymalizując ich funkcjonalność przy użyciu modeli głębokiego uczenia i sieci generatywnych
Kryteria oceniania
Student może mieć 1/3 nieobecności (5 nieobecności przy założeniu 15 zajęć w semestrze).
Ocena wystawiana będzie na podstawie projektu zaliczeniowego
Praktyki zawodowe
nie dotyczy
Literatura
Machine Learning in Chemistry: The Impact of Artificial Intelligence" – Hugh M. Cartwright
Więcej informacji
Więcej informacji o poziomie przedmiotu, roku studiów (i/lub semestrze) w którym się odbywa, o rodzaju i liczbie godzin zajęć - szukaj w planach studiów odpowiednich programów. Ten przedmiot jest związany z programami:
- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: