====== SYNv11 ====== Přehled toho, co potřebujeme k práci a jak postupuje. ===== Potřebné programové nástroje ===== * Morfologický slovník, originál na **grimmovi** a **chomském**: \\ ''/usr/local/syn2020/morphodita/czech-morfflex-pdt-c.dict'' * LEX, originál na **grimmovi** (z **langra**): \\ ''/usr/local/syn2020/LEX_ucs2'' * skripty a seznamy, originál na **grimmovi**: \\ ''/usr/local/syn2020'' \\ ''/usr/local/syn2020/versions/20220?'' * MorphoDiTa, originál na **lovelace**: \\ ''/cnk/work/lovelace/embeddings'' \\ ''/cnk/work/lovelace/MorphoditaModels'' \\ na **grimmovi**: \\ ''/usr/local/syn2020/morphodita-research/embeddings'' \\ ''/usr/local/syn2020/morphodita-research/models/Current_Model'' ===== Data ===== Soubor ''SYNv11'' tvoří ''SYNv10'' a ''NEWTON2021''. Data jsou na grimmovi v adresáři ''/store/corp/SYNv11''. ===== Postup prací ===== Rozdělení dat mezi stroje, postup prací. ==== Jednotlivé korpusy ==== * ''SYNv8/SYNv8_a-i_'': * tagování (26.7.-) --- **''lovelace''** * kolokace * ''SYNv8_j-ln-z'': * tagování --- **''lovelace''** * kolokace * ''SYNv8_m'': * tagování --- **''lovelace''** * kolokace * ''NEWTON2021'': * tagování (**10.8.-11.8.2022**) --- **''grimm''** * kolokace * ''SYN2020'': * tagování (**9.8.2022**) --- **''grimm''** * kolokace (**9.8.-10.8.2022**) --- **''grimm''** * ''vert-corr'' (**10.8.2022**) --- **''grimm''** ==== Adresář ==== * **''lovelace''**: ''~/cnk-home/SYNv11'' * **''grimm''**: ''/store/corp/SYNv11''