2023-143-4

NER z angl. Named Entity Recognition

Vedoucí práce: Prof. Mgr. Daniel Svozil, Ph.D.

Konzultant: -

Podstata a cíl práce

Ropoznávání pojmenovaných entit (NER, z anglického Named Entity Recognition) se zabývá nalezením a klasifikací názvů či objektů v nestrukturovaním volném textu, jako jsou např. chemické názvy (tzv. ChemNER). Pro ChemNER již bylo vyvinuto mnoho softwarových open-source nástrojů, jejichž kvalitu je však mezi sebou obtížné porovnat, neboť byly testovány na různých textových množinách. Cílem práce je porovnat volně dostupné ChemNER systémy za použití jednotné testovací sady s cílem identifikovat optimální systém.

Náplň činnosti studenta

Student provede rešerši volně dostupných ChemNER systémů, navrhne vhodný korpus (textovou nožinu) pro jejich otestování, navrhne optimální míru pro porovnání ChemNER systémů a tyto vzápětí mezi sebou porovná.

Doplňující informace

Místo řešení: Ústav informatiky a chemie (143)

Téma je možné zvolit pro následující specializace