Table of Contents
SYNv11
Přehled toho, co potřebujeme k práci a jak postupuje.
Potřebné programové nástroje
- Morfologický slovník, originál na grimmovi a chomském:
/usr/local/syn2020/morphodita/czech-morfflex-pdt-c.dict - LEX, originál na grimmovi (z langra):
/usr/local/syn2020/LEX_ucs2 - skripty a seznamy, originál na grimmovi:
/usr/local/syn2020
/usr/local/syn2020/versions/20220? - MorphoDiTa, originál na lovelace:
/cnk/work/lovelace/embeddings
/cnk/work/lovelace/MorphoditaModels
na grimmovi:
/usr/local/syn2020/morphodita-research/embeddings
/usr/local/syn2020/morphodita-research/models/Current_Model
Data
Soubor SYNv11 tvoří SYNv10 a NEWTON2021.
Data jsou na grimmovi v adresáři /store/corp/SYNv11.
Postup prací
Rozdělení dat mezi stroje, postup prací.
Jednotlivé korpusy
SYNv8/SYNv8_a-i_:- tagování (26.7.-) —
lovelace - kolokace
SYNv8_j-ln-z:- tagování —
lovelace - kolokace
SYNv8_m:- tagování —
lovelace - kolokace
NEWTON2021:- tagování (10.8.-11.8.2022) —
grimm - kolokace
SYN2020:- tagování (9.8.2022) —
grimm - kolokace (9.8.-10.8.2022) —
grimm vert-corr(10.8.2022) —grimm
Adresář
lovelace:~/cnk-home/SYNv11grimm:/store/corp/SYNv11