Table of Contents

Výroba korpusu SYN2020 a dalších ve stejném formátu a stejnými nástroji

Přípravná fáze

Příprava korpusu z Tomášových dat

Cvičný SYN2015

Ostrá fáze

Odstranění XML značek

process_text.sh

Vstupní data

Přepínače

Kontroly a finální úpravy pro předání

Kontroly
Finální úpravy a kontrola Vondřičkou

Korpus SYN2020_predvyber-sublemma

Korpus SYN2020_predvyber-rules-MorphoDiTa, kontrola souborů pro ČNK

Vertikály pro ČNK

Zmrazené a distribuční verze

Zmrazená verze

Distribuční verze

Programy se dají distribuovat na systémy, které splňují následující SW požadavky:

Distribuce se provádí v zazipovaném souboru, který vznikne spuštěním programu make-ver2020-distr.sh v adresáři se zmrazenou verzí:

cd /usr/local/syn2020/versions/202105
make-ver2020-distr.sh

Archiv disamb-2020-distr-202105.zip se zkopíruje na vzdálený stroj a rozbalí do adresáře, ve kterém má být umístěn celý balík. Potom se spustí program set-env.sh:

cd distr_home/202105
bin/set-env

a objeví se hláška

Put .versyn2020.rc to your HOME and use the command
bash --rcfile ${HOME}/.versyn2020.rc

Ještě je třeba zkontrolovat, jestli se správně přepsal soubor options.json:

lh syn2020/morphodita-research/models/Current_Model/options.json

Pro běh programu je třeba nastavit prostředí a v případě, že lokální instalace MorphoDiTy vyžaduje ještě vlastní nastavení, je třeba spustit i to. Na sag.korpus.cz je to

source /usr/local/morphodita-research/env/bin/activate