Automatická morfologická analýza češtiny, strojové slovníky češtiny

Výzkum se zaměřuje na lingvistické aspekty budování nástrojů počítačového zpracování přirozeného jazyka (Natural Language Processing), zejména na nástroje automatické morfologické a slovotvorné analýzy češtiny a na strojové slovníky a další databáze, nad nimiž operují různé aplikace (software NLP).

lidé

doc. PhDr. Klára Osolsobě, Dr.

Mgr. Dana Hlaváčková, Ph.D. 

granty

2013–2016 GA13-07138S Slovník afixů užívaných v češtině

LM2011023 – Český národní korpus (2012–2015, MSM/LM) 

LM2015044 – Český národní korpus (2016–2017, MSM/LM) 

publikace

Osolsobě, Klára & Hlaváčová, Jaroslava & Petkevič, Vladimír & Šimandl, Josef & Svášek, Martin. 2017. Nová automatická morfologická analýza češtiny. Naše řeč 100 (4). Praha: Ústav pro jazyk český Akademie věd ČR. 225–234.

Osolsobě, Klára. 2015. Korpusy jako zdroje dat pro úpravy nástrojů automatické morfologické analýzy (Slovotvorné varianty adjektiv na [(ou)|í]cí z hlediska morfologického značkování). Časopis pro moderní filologii 97 (2). Praha: Univerzita Karlova v Praze. 136–145.

Osolsobě, Klára & Šmerk, Pavel & Pala, Karel & Hlaváčková, Dana. 2015. Deriv – softwarový nástroj pro testování mezí a možností automatické slovotvorné analýzy. In J. Hlaváčová (ed.), Sborník semináře o digitálních zdrojích a službách ve společenských a humanitních vědách. Praha: ÚFAL MFF UK. 42–46.

Osolsobě, Klára. 2014. Česká morfologie a korpusy. Praha: Karolinum.

Hlaváčková, Dana. 2013. Korpusové zpracování korespondenčních textů: morfologické značkování. In Z. Hladká et al. (eds.), Soukromá korespondence jako lingvistický pramen. Brno: Masarykova univerzita. 19–31.

Hlaváčková, Dana & Horák, Aleš. 2006. VerbaLex – New Comprehensive Lexicon of Verb Valencies for Czech. In Computer Treatment of Slavic and East European Languages. Bratislava: Slovenský národný korpus. 107–115.

 

publikace s podílem studentů:

Stará, Marie & Kovář, Vojtěch. 2016. Options for Automatic Creation of Dictionary Definitions from Corpora. In A. Horák & P. Rychlý & A. Rambousek (eds.), Tenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2016. Brno: Tribun EU. 111–124.

Ryšavá, Daniela & Volková, Nikol & Rambousek, Adam. 2015. Converting the Corpus Query Language to the Natural Language. In A. Horák & P. Rychlý & A. Rambousek (eds.), Ninth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2015. Brno: Tribun EU. 43–48.

Pala, Karel & Svoboda, Ondřej. 2014. An Experiment with Theme–Rheme Identification. In P. Sojka & A. Horák & I. Kopeček & K. Pala (eds.), An Experiment with Theme–Rheme Identification. Berlin, Heidelberg: Springer Verlag. 275–284.

Hlaváčková, Dana & Grác, Marek & Sedlářová, Pavlína. 2011. Budování anotovaného korpusu bez odborníků. In F. Čermák (ed.), Korpusová lingvistika 2 – Výzkum a výstavba korpusů. Praha: Nakladatelství Lidové noviny. 132–139.