Automatická morfologická analýza češtiny, strojové slovníky češtiny

Charakteristika

Výzkum se zaměřuje na lingvistické aspekty budování nástrojů počítačového zpracování přirozeného jazyka (Natural Language Processing), zejména na nástroje automatické morfologické analýzy češtiny a využití jazykových korpusů ve výuce češtiny jako L2.

Lidé

doc. PhDr. Klára Osolsobě, Dr.
Mgr. Dana Hlaváčková, Ph.D.
Mgr. Hana Žižková, Ph.D.

Granty

Využití strojového učení při detekci společného argumentu v koordinovaných strukturách, (MUNI/A/1184/2020), 2021
Cyklus přednášek a panelových diskuzí z oblasti počítačové lingvistiky, (MUNI/FR/1083/2019), 2020

Publikace

Osolsobě, Klára a Hana Žižková. Typ kladenští jako problém automatické morfologické analýzy. Jazykovedný časopis. SAP – Slovak Academic Press, s. r. o., 2022, roč. 72, č. 4, s. 862-872. ISSN 0021-5597. Dostupné z: https://dx.doi.org/10.2478/jazcas-2022-0011.
Osolsobě, Klára. Morfematika. In Štícha, František. Velká akademická gramatika spisovné češtiny II. Morfologie. 1. vyd. Praha: Academia, 2022, s. 369-395. ISBN 978-80-200-3185-3.
Hlaváčková, Dana, Hana Žižková, Klára Dvořáková a Markéta Pravdová. Developing Online Czech Proofreader Tool : Achievements, Limitations and Pitfalls. Bohemistyka. Państwowa Wyższa Szkoła Zawodowa, 2022, roč. 22, č. 1, s. 122-134. ISSN 1642-9893. Dostupné z: https://dx.doi.org/10.14746/bo.2022.1.7.
Osolsobě, Klára a Hana Žižková. HOMONYMIE MEZI OIKONYMY A ANTROPONYMY ZAKONČENÝMI NA -SLAV/-SLAVA JAKO PROBLÉM AUTOMATICKÉ MORFOLOGICKÉ ANALÝZY. Acta onomastica. AV ČR, Ústav pro jazyk český, 2020, roč. 62, č. 2, s. 377-403. ISSN 1211-4413.
Osolsobě, Klára a Hana Žižková. Homonymie mezi apelativy a proprii jako problém automatické morfologické analýzy češtiny. Acta onomastica. AV ČR, Ústav pro jazyk český, 2020, roč. 61, č. 1, s. 161-174. ISSN 1211-4413.
Osolsobě, Klára a Hana Žižková. Reduplikace v etymologické figuře typu hlava nehlava jako konvenční model pro kreativní idiomatické tvoření. In Balowski, Mieczyslaw. Konwencja i kreacja w jezyku i w literaturze czeskiej. Poznaň: Institut Filologii Slowianskiej, Universytet im. A. Mickiewicza, 2020, s. 241-267. Bohemica Posnaniensia, 24. ISBN 978-83-63090-33-3.
Osolsobě, Klára. Synonymní/variantní tvary infinitivu jako problém konzistentní lemmatizace. In Jana, Bílková; Kolářová, Ivana; Vondráček, Miloslav. Lingvistika – korpus – empirie. 1. vyd. Praha: Ústav pro jazyk český AV ČR, v. v. i., 2020, s. 28-41. Lingvistika – korpus – empirie. ISBN 978-80-88211-13-6.
Osolsobě, Klára a Hana Žižková. Improving Nominalized Adjectives Tagging. Jazykovedný časopis. Bratislava: Jazykovedný ústav Ľudovíta Štúra Slovenskej akadémie vied, 2019, roč. 70, č. 2, s. 370-379. ISSN 0021-5597. Dostupné z: https://dx.doi.org/10.2478/jazcas-2019-0066.
Osolsobě, Klára a Jaroslava Hlaváčová. Chystané změny projektu NovaMorf jako výsledek dlouhého období konvergencí a divergencí ve zpracování české morfologie. In Aleš Horák, Klára Osolsobě, Adam Rambousek, Pavel Rychlý (eds.) Slavonic Natural Language Processing in the 21st Century. 1. vyd. Brno: Tribun EU, 2019, s. 93-99. ISBN 978-80-263-1545-2.
Osolsobě, Klára. The Tagged Corpus (SYN2010 ) as a Help and a Pitfall in the Word-formation Research. Online. In Zdeněk Žabokrtský, Magda Ševčíková, Eleonora Litta, Marco Passarotti. Proceedings of the Second International Workshop on Resources and Tools for Derivational Morphology. Praha: Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics, 2019, s. 55-59. ISBN 978-80-88132-08-0.

Publikace s podílem doktorských studentů

Sokolova, Anastasija, Ivana Kolářová a Adriana Válková. Word-formation Analysis Software Tool for Teaching Czech for Foreigners (SLAN). An interim report. Linguistica Pragensia. Prague: Faculty of Arts, Charles University, 2023, roč. 33, č. 2, s. 211-221. ISSN 0862-8432. Dostupné z: https://dx.doi.org/10.14712/18059635.2023.2.6.
Sokolova, Anastasija, Ivana Kolářová, Adriana Válková a Tomáš Káňa. Slovotvorný analyzátor pro výuku češtiny pro cizince (SLAN). 2023.
Válková, Adriana. Building Czech Textbook Corpora (UcebKo) for Word-formation Research of Czech as a Second Language. Jazykovedný časopis. Jazykovedný ústav Ľudovíta Štúra Slovenskej akadémie vied, 2021, roč. 72, č. 2, s. 631-640. ISSN 0021-5597. Dostupné z: https://dx.doi.org/10.2478/jazcas-2021-0057.
Citterberg, Erik a Adriana Válková. Processing of Derivational Features for (Semi)Automatic Creation of Dictionary Definitions in the User Interface (CZEDD) for Learning Czech as a Second Language: Suffix -tel and -ista. Jazykovedný časopis. Jazykovedný ústav Ľudovíta Štúra Slovenskej akadémie vied, 2019, roč. 70, č. 2, s. 444-455. ISSN 0021-5597. Dostupné z: https://dx.doi.org/10.2478/jazcas-2019-0073.