Table of Contents

Variabilita

Tagování textů a generování tvarů pro databázi variability.

Tagování si má být co nejpodobnější, a proto vše sjíždíme stejnými nástroji a neděláme žádné dodatečné úpravy. Jednotlivé součásti ale potřebují speciální přípravu a potom zase nápravu.

Tagování korpusů

Příprava dat

Data dostáváme ve vertikále s mark-upem. Některá vertikála má jenom formy, některá i lemmata a tagy, a některá původní formy. Každá má ale trochu jiný mark-up. Většinu mark-upu můžeme vyházet, protože pro účely variability není zapotřebí.

new_diakorp_v6

oral_vertikala

ortofon_vertikala

vert_archiv_19_stol

Tagování

Závěrečné kontroly a úpravy

Generování tvarů