Table of Contents

Ruční anotace korpusů

Návod jak připravit data pro anotátory a potom jimi označkovaná data dále zpracovat.

Příprava dat

Data musí být v csts. Máme-li vertikálu, použijeme program vert_csts.pl. Konvence pro pojmenovávání adresářů je:

Chceme-li využít na každý soubor dva anotátory, budeme potřebovat více adresářů:

Převod z vertikály do csts provedeme klasickým příkazem

make-corp.sh -s vert-import -t csts-import -v -p45

Převod z csts zpět do vertikály provádíme příkazem csts_vert_annot.pl.

Import dat

Export dat

Starší metoda

Novější metoda

Tato metoda kontroluje, jestli anotátor na soubor vůbec sáhl. Taky vytváří potřebné adresáře a zpracované soubory přsouvá do adresáře $path-import-done

Sloučení dat od dvou anotátorů