Tvorba a vytěžování specializovaných korpusů

Výzkum se zaměřuje na budování specializovaných korpusů (korpusy mluvené češtiny, korpusy korespondenčních textů 19. a 20. století, diachronní korpusy českých biblí, korpusy češtiny nerodilých mluvčích, korpus mluvy rozhlasových hlasatelů, korpus mluvy afatiků ad.). Specializované korpusy slouží k synchronně i diachronně zaměřeným  analýzám jevů všech jazykových rovin, k sociolingvisticky orientovanému studiu, jako podklad pro tvorbu výukových a teraupetických aplikací apod.

V Ústavu českého jazyka vznikly dva korpusy, které jsou součástí Českého národního korpusu – Brněnský mluvený korpus (BMK) a Korpus soukromé korespondence (KSK – dopisy). 

Lidé

  • prof. Mgr. Radek Čech, Ph.D.
  • doc. PhDr. Zdeňka Hladká, Dr.
  • Mgr. Dana Hlaváčková, Ph.D.
  • Mgr. Hana Žižková, Ph.D.

Granty

  • Webový pravopisný, gramatický a typografický korektor pro český jazyk, (TL02000146), 2019–2022
  • Soukromá korespondence 20. století. Rozšíření korpusových zdrojů, nové možnosti lingvistického využití, (P406/10/0823), 2010–2012
  • Současná soukromá korespondence. Vytvoření databáze a zpracování vybraných jevů z pohledu lexikologicko-lexikografického a dialektologického, (GA405/03/0248), 2003–2005

Publikace

  • Rychnovská, Lucie. Čeština Bedřicha Smetany. Analýza Smetanovy česky psané korespondence. 1. vyd. Brno: Masarykova univerzita, 2019. 205 s. Spisy Filozofické fakulty Masarykovy univerzity, č. 488. ISBN 978-80-210-9282-2. [Práce se opírá se o korpus odeslané a přijaté korespondence B. Smetany vytvořený pro badatelské účely v ÚČJ FF MU ve spolupráci s CZPJ FI MU. Materiál poskytlo Muzeum Bedřicha Smetany.]
  • Hladká, Zdeňka. 2015. Korpus soukromé korespondence: zkušenosti a perspektivy. In M. Šimková, Človek a jeho jazyk. 3. Inšpirácie profesora Jána Horeckého. Bratislava: VEDA. 616–620
  • Hladká, Zdeňka. 2013. Corpora of Private Correspondence as a Source of Material Focused on a Research of Diminutives. In K. Gajdošová & A. Žáková, Natural Language Processing, Corpus Linguistics, E-learning: SLOVKO 2013. Lüdenscheid: RAM-Verlag. 81–91.
  • Hladká, Zdeňka & Malčík, Petr (eds.). 2013. Soukromá korespondence jako lingvistický pramen. Brno: Masarykova univerzita.
  • Hladká, Zdeňka. 2013. 111 let českého dopisu v korpusovém zpracování. (Práce vznikla za spolupráce studentů FF MU a programátorů FI MU). Brno: Masarykova univerzita.
  • Osolsobě, Klára & Machalová, Jana. 2013. Hypokoristika z rodných jmen v Korpusu soukromé korespondence. In Z. Hladká et al. (eds.), Soukromá korespondence jako lingvistický pramen. Brno: Masarykova univerzita. 33–59.
  • Hlaváčková, Dana. 2013. Korpusové zpracování korespondenčních textů: morfologické značkování. In Z. Hladká et al. (eds.). Soukromá korespondence jako lingvistický pramen. Brno: Masarykova univerzita. 19–31.
  • Hlaváčková, Dana & Osolsobě, Klára. 2008. Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky. In M. Kopřivová & M. Waclawičová (eds.), Čeština v mluveném korpusu. Praha: Nakladatelství Lidové noviny / Ústav Českého národního korpusu. 105–114.
  • Hlaváčková, Dana & Sedláček, Radek. 2006. Morfologické značkování korpusu soukromé korespondence. In Varia XIV. Bratislava: Slovenská jazykovedná spoločnosť pri SAV. 371–379.
  • Hladká, Zdeňka et al. 2005. Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS. Brno: Masarykova univerzita.
  • Hlaváčková, Dana. 2001. Korpus mluvené češtiny z brněnského prostředí a jeho morfologické značkování. Slovo a slovesnost 62 (1). Praha: Ústav pro jazyk český Akademie věd ČR. 62–70.

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info