2023-143-4
Vedoucí práce: Prof. Mgr. Daniel Svozil, Ph.D.
Konzultant: -
Ropoznávání pojmenovaných entit (NER, z anglického Named Entity Recognition) se zabývá nalezením a klasifikací názvů či objektů v nestrukturovaním volném textu, jako jsou např. chemické názvy (tzv. ChemNER). Pro ChemNER již bylo vyvinuto mnoho softwarových open-source nástrojů, jejichž kvalitu je však mezi sebou obtížné porovnat, neboť byly testovány na různých textových množinách. Cílem práce je porovnat volně dostupné ChemNER systémy za použití jednotné testovací sady s cílem identifikovat optimální systém.
Student provede rešerši volně dostupných ChemNER systémů, navrhne vhodný korpus (textovou nožinu) pro jejich otestování, navrhne optimální míru pro porovnání ChemNER systémů a tyto vzápětí mezi sebou porovná.
Místo řešení: Ústav informatiky a chemie (143)