original
, do kterého umístíme zdrojové souborycsts
, do kterého umístíme vertikálu převedenou do cstsUTF-8
:cut -f1 <vertikala> | vert_csts_simple.pl
cut -f1 <vertikala> | cstocs il2 utf8 | vert_csts_simple.pl
frozen
stavem):make-corp.sh -A1 -B1 -Eucs2 -M -p45 -s csts -t csts-morf -v
make-whole-corp-csts.sh -Eucs2 -M -C1 -f -p45 -trules -v
csts_vert_simple.pl
:mkdir vert-corr sts_vert_simple.pl < csts-rules-frazrl-rulh1-tag-vid-corr/<file> > vert-corr/<file>
src
a mark-upemvert-Srovnani
a v něm vytvoříme sloučenou vertikálu:paste original-utf8/vertikala_v2 <(cut -f2- vert-corr/<file>) | perl -pe 's/[\t]+<.*$//' |\ compare-old-new-tagging.pl > vert-Srovnani/<file>
manatee-registry.sh -c. -f vert-Srovnani -C
a na jakobsonovi spustíme nosketch-registry.sh
:
nosketch-registry.sh /net/chomsky/store/manatee-registry/<korpus>