Automatická morfologická analýza češtiny, strojové slovníky češtiny
Výzkum se zaměřuje na lingvistické aspekty budování nástrojů počítačového zpracování přirozeného jazyka (Natural Language Processing), zejména na nástroje automatické morfologické a slovotvorné analýzy češtiny a na strojové slovníky a další databáze, nad nimiž operují různé aplikace (software NLP).
Lidé
- doc. PhDr. Klára Osolsobě, Dr.
- Mgr. Dana Hlaváčková, Ph.D.
Granty
- Český národní korpus (LM2015044, MSM/LM), 2016–2017
- Slovník afixů užívaných v češtině, (GA13-07138S), 2013–2016
- Český národní korpus (LM2011023, MSM/LM), 2012–2015
Publikace
- Osolsobě, Klára & Hlaváčová, Jaroslava & Petkevič, Vladimír & Šimandl, Josef & Svášek, Martin. 2017. Nová automatická morfologická analýza češtiny. Naše řeč 100 (4). Praha: Ústav pro jazyk český Akademie věd ČR. 225–234.
- Osolsobě, Klára. 2015. Korpusy jako zdroje dat pro úpravy nástrojů automatické morfologické analýzy (Slovotvorné varianty adjektiv na [(ou)|í]cí z hlediska morfologického značkování). Časopis pro moderní filologii 97 (2). Praha: Univerzita Karlova v Praze. 136–145.
- Osolsobě, Klára & Šmerk, Pavel & Pala, Karel & Hlaváčková, Dana. 2015. Deriv – softwarový nástroj pro testování mezí a možností automatické slovotvorné analýzy. In J. Hlaváčová (ed.), Sborník semináře o digitálních zdrojích a službách ve společenských a humanitních vědách. Praha: ÚFAL MFF UK. 42–46.
- Osolsobě, Klára. 2014. Česká morfologie a korpusy. Praha: Karolinum.
- Hlaváčková, Dana. 2013. Korpusové zpracování korespondenčních textů: morfologické značkování. In Z. Hladká et al. (eds.), Soukromá korespondence jako lingvistický pramen. Brno: Masarykova univerzita. 19–31.
- Hlaváčková, Dana & Horák, Aleš. 2006. VerbaLex – New Comprehensive Lexicon of Verb Valencies for Czech. In Computer Treatment of Slavic and East European Languages. Bratislava: Slovenský národný korpus. 107–115.
Publikace s podílem studentů:
- Stará, Marie & Kovář, Vojtěch. 2016. Options for Automatic Creation of Dictionary Definitions from Corpora. In A. Horák & P. Rychlý & A. Rambousek (eds.), Tenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2016. Brno: Tribun EU. 111–124.
- Ryšavá, Daniela & Volková, Nikol & Rambousek, Adam. 2015. Converting the Corpus Query Language to the Natural Language. In A. Horák & P. Rychlý & A. Rambousek (eds.), Ninth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2015. Brno: Tribun EU. 43–48.
- Pala, Karel & Svoboda, Ondřej. 2014. An Experiment with Theme–Rheme Identification. In P. Sojka & A. Horák & I. Kopeček & K. Pala (eds.), An Experiment with Theme–Rheme Identification. Berlin, Heidelberg: Springer Verlag. 275–284.
- Hlaváčková, Dana & Grác, Marek & Sedlářová, Pavlína. 2011. Budování anotovaného korpusu bez odborníků. In F. Čermák (ed.), Korpusová lingvistika 2 – Výzkum a výstavba korpusů. Praha: Nakladatelství Lidové noviny. 132–139.