2025-143-12

Validace molekulových deskriptorů a algoritmů strojového učení pro predikci biologické aktivity sloučenin

Vedoucí práce: Ing. Martin Šícho, Ph.D.

Konzultant: -

Podstata a cíl práce

Quantitative Structure Activity Relationship (QSAR) je zásadním aspektem v oblasti chemoinformatiky a medicinální chemie, neboť se věnuje analýze vztahů mezi biologickými účinky a chemickými vlastnostmi látek. Tato disciplína se soustřeďuje na vytváření matematických modelů, které propojují chemickou strukturu sloučenin s jejich biologickou aktivitou. Díky tomu QSAR usnadňuje systematický a logický přístup k návrhu nových léčiv a biologicky aktivních látek. Klíčovou roli v QSAR mají molekulové deskriptory. Jsou to kvantitativní reprezentace struktury chemických sloučenin, které slouží k popisu různých fyzikálních, chemických a biologických vlastností molekul. Tyto deskriptory mohou zahrnovat informace o atomovém složení, geometrii molekuly, elektrostatických a sterických vlastnostech a mnoho dalších charakteristik. Výběr vhodných molekulových deskriptorů a jejich správné použití jsou klíčové pro úspěšné vytváření QSAR modelů, které mají predikční hodnotu. Tato studentská práce se zaměřuje na vytvoření validační množiny z veřejně dostupných dat o biologické aktivitě sloučenin a na analýzu různých typů molekulových deskriptorů. Cílem je poskytnout užitečné poznatky a metodické postupy, které mohou přispět k rozvoji QSAR a optimalizaci procesu návrhu biologicky aktivních sloučenin.

Náplň činnosti studenta

Student se nejprve zaměří na sběr data a extrakci vhodných datových množin z veřejně dostupných dat. Následně vytvoří seznam vhodných deskriptorů pro QSAR modelování, pomocí kterých vytvoří několik modelů pro porovnání. Nakonec provede analýzu výsledků a zhodnotí jednotlivé deskriptory z hlediska vlivu na kvalitu modelů.

Doplňující informace

Místo řešení: Ústav informatiky a chemie (143)

Téma je možné zvolit pro následující specializace