Výukové materiály
Některé dokumenty jsou uloženy ve formátu PDF. Pro jejich prohlížení je nutno mít nainstalovaný program Adobe Reader (download). Většina z těchto dokumentů je nadto zaheslována, pro jejich otevření je nutno znát HESLO.
Bonito/Manatee
- Korpusový manažer Bonito - manuál (.html)
- Bonito tutoriál (ÚFAL) (.html)
- Dotazovací jazyk korpusového manažeru Manatee/Bonito - tutoriál (.html)
- Word Sketch Engine - manuál Začínáme s Bonitem2 (M. Šulc) - (.pdf)
- Dotazovací jazyk manažeru Manatee/Bonito (doplněk) (.html) (sk)
- Getting Started with the Sketch Engine (.html) (en)
- Bonito - videotutoriál - ÚFAL MFF UK Praha (en)
- Víte, co je "bonito"? Pokud ne, klikněte ZDE. :-) (en)
- Vyhledávácí vzory - Bonito (.pdf) (cz)
Morfologické tagsety
- Pražský morfologický tagset (poziční systém, J. Hajič) - popis (.html)
- Brněnský morfologický tagset (atributivní systém, NLP FI MU) - popis (.pdf)
- Manuál pro značkování a desambiguaci slovních tvarů v jazykových korpusech (NLP FI MU) (.pdf)
- Poziční morfologický tagset - tabulka (.pdf)
- Ajka - přehled symbolů (.pdf)
- Ajka -tagset (.pdf)
- Ajka - ukázky výstupu (.pdf)
- Morfologické značky korpusu orw-mte (V. Petkevič) (.html)
- Czech Part-Of-Speech Tagset (Xerox) (.html) (en)
- Czech Morphology: Categories (Xerox) (.html) (en)
Tvorba malých autorských korpusů (Pořízka - Schäfer)
Odborné stati (nyní v tisku), jež se zabývají problematikou tvorby korpusů s využitím korpusového manažeru Manatee/Bonito (v1).
- Korpus esejů Otokara Březiny (fragment korpusu české esejistiky přelomu 19./20. století) (.pdf)
- Svět jako vědomí a nic Ladislava Klímy v olomouckém korpusu české esejistiky přelomu 19. a 20. století (.pdf)
Regulární výrazy
- Regulární výrazy v Manatee/Bonitu
- Regex - třídílný tutoriál - Zvon.org - *1 2 3* (cz) - DOPORUČUJEME
- Regex - tutoriál 2 (cz; Pavel Satrapa)
- Online testery, software, přehled (cz)
- Základy regulárních výrazů - přehled (cz)
- Test regulárních výrazů - Regexp.cz (cz; PHP, Perl, JavaScript, Awk)
- Seriál na Root.cz (cz)
- Regulární výrazy v příkladech - Root.cz (cz)
- Learning to Use Regular Expressions (en)
- Regulární výrazy - wikipedie (cz)
- Regexp nástroje pro Windows (cz)
- Regulární výrazy - Satrapa Pavel (vytvořeno pro Root.cz) (cz; .pdf)
XML (eXtensible Markup Language)
- XML v deseti bodech (cz)
- Úvod do XML - seriál (cz; Jiří Kosek)
- XML pro každého - portál - materiály z webu Jiřího Koska (cz)
- XML pro každého (Jiří Kosek) - plná verze knihy pro začátečníky (.pdf)
- XML tutoriál - Zvon.org (cz) - DOPORUČUJEME
- XML aneb nový formát pro nové tisíciletí - seriál (cz)
- Programujeme s XML - seriál pro pokročilé (cz)
Varia
- STYX - elektronická cvičebnice češtiny založená na PZK (PDT) (ÚFAL MFF UK)
- Videotutoriály ÚFAL MFF UK (většina v angličtině!)
- w3schools tutorials (en) - html, xml, php, sql ad.
- Corpus Linguistics by Tony McEnery and Andrew Wilson (en)
- Research Issues in Applied Linguistics by Tony McEnery and Andrew Wilson (en)
- SIL: Glossary of Linguistic Terms (en)
- FrameNet (en)
Kódování znaků
- přehled kódování znaků pro češtinu (cz)
- tabulky kódování v HTML (cz)
- kódování - čeština (cz)
- tabulky českých kódování (cz)
- konverzní tabulky (cz)
- rozdíl mezi ISO a WIN kódováním pro češtinu (cz)
- kódování: přehled chybných zobrazení (cz)
- program pro konverzi kódování (cz)
- online konvertor (cz)
- programy pro konverzi kódování češtiny (cz)
Počítač
Windows - příkazový řádek (konzola)
- základy práce s konzolou (.pdf)
- základní příkazy systému (cz)
- programování v příkazové řádce OS Windows (O. Ševeček)
Práce s textem
- Jak vyhledávat a nahrazovat text (OpenOffice Writer) - princip týž pro všechny textové editory nebo procesory
- Vyhledání a nahrazení textu nebo dalších položek (MS Office) - princip platný obecně
- Jak rychle vyhledat a nahradit požadovaný text (MS Office) - princip platný obecně
- Jak používat funkci Najít a nahradit (MS Office) - princip platný obecně
- Utilita Multisave a Multidiff v OpenOffice Writer - možno ukládat dokument zároveň v několika formátech
- Vyhledávání textu pomocí speciálních znaků (MS Office)
Oborné studie
- Blatná, R.: Využití statistických metod při popisu neverbálních kolokací (.pdf)
- Čermák, F. - Schmiedtová, V.: Český národní korpus - základní charakteristika a širší souvislosti (.pdf)
- Čmejrková, S. - Jílková, L. - Kaderka, P.: Mluvená čeština v televizních debatách: korpus DIALOG (.pdf)
- Hajičová, E.: K některým otázkám závislostní gramatiky (.pdf)
- Hladká, B.: Pražský závislostní korpus aneb Co tady před padesáti lety nebylo (.pdf)
- Hladká, B. - Králík, J.: Proměna Českého akademického korpusu (.pdf)
- Jindra, V.: Vývojová dynamika obouvidových sloves cizího původu na základě korpusových dat (.pdf)
- Kopřivová M.: Využití korpusu při zpracování frazeologie ve výkladovém slovníku (.doc)
- Kodýtek, V.: Mluvená čeština v Praze a Brně: sonda do mluvených korpusů (.pdf)
- Králík, J.: Aktualizace rozvržení zdrojů Českého národního korpusu s ohledem na revizi vyváženosti jeho struktury (.pdf)
- Kučera, O.: Pražský závislostní korpus jako elektronická cvičebnice češtiny (.pdf)
- Osolsobě, K. - Pala, K. - Rychlý, P.: Frekvence vzorů českých sloves (na materiálu ČNK) (.rtf)
- Osolsobě, K. - Pala, K. - Rychlý, P.: Frekvence vzorů českých substantiv (na materiálu ČNK) (.rtf)
- Pala, K.: Počítačové zpracování přirozeného jazyka (.pdf)
- Průvodce PDT 2.0 (.pdf)
- Rosen, A.: Jak na paralelní texty s programem ParaConc (.pdf)
- Uhlířová, L.: Gramatika v korpusu, korpus v gramatice: příspěvek k diskusi o vyhledávání gramatické informace v korpusech (.pdf)
Úložiště dat
Do úložiště jsou umísťovány datově objemnější soubory. Materiály je možno z úložiště otevírat i stahovat pro potřeby kurzů. Pro přístup je třeba znát LOGIN a HESLO.
Obsah úložiště viz v sekci Výukové materiály.
***VSTUP ZDE***