Table of Contents
SYNv11
Přehled toho, co potřebujeme k práci a jak postupuje.
Potřebné programové nástroje
- Morfologický slovník, originál na grimmovi a chomském:
/usr/local/syn2020/morphodita/czech-morfflex-pdt-c.dict
- LEX, originál na grimmovi (z langra):
/usr/local/syn2020/LEX_ucs2
- skripty a seznamy, originál na grimmovi:
/usr/local/syn2020
/usr/local/syn2020/versions/20220?
- MorphoDiTa, originál na lovelace:
/cnk/work/lovelace/embeddings
/cnk/work/lovelace/MorphoditaModels
na grimmovi:
/usr/local/syn2020/morphodita-research/embeddings
/usr/local/syn2020/morphodita-research/models/Current_Model
Data
Soubor SYNv11
tvoří SYNv10
a NEWTON2021
.
Data jsou na grimmovi v adresáři /store/corp/SYNv11
.
Postup prací
Rozdělení dat mezi stroje, postup prací.
Jednotlivé korpusy
SYNv8/SYNv8_a-i_
:- tagování (26.7.-) —
lovelace
- kolokace
SYNv8_j-ln-z
:- tagování —
lovelace
- kolokace
SYNv8_m
:- tagování —
lovelace
- kolokace
NEWTON2021
:- tagování (10.8.-11.8.2022) —
grimm
- kolokace
SYN2020
:- tagování (9.8.2022) —
grimm
- kolokace (9.8.-10.8.2022) —
grimm
vert-corr
(10.8.2022) —grimm
Adresář
lovelace
:~/cnk-home/SYNv11
grimm
:/store/corp/SYNv11