Wiki spuštěna 24. 7. 2025

SYNv11

Přehled toho, co potřebujeme k práci a jak postupuje.

Potřebné programové nástroje

  • Morfologický slovník, originál na grimmovi a chomském:
    /usr/local/syn2020/morphodita/czech-morfflex-pdt-c.dict
  • LEX, originál na grimmovi (z langra):
    /usr/local/syn2020/LEX_ucs2
  • skripty a seznamy, originál na grimmovi:
    /usr/local/syn2020
    /usr/local/syn2020/versions/20220?
  • MorphoDiTa, originál na lovelace:
    /cnk/work/lovelace/embeddings
    /cnk/work/lovelace/MorphoditaModels
    na grimmovi:
    /usr/local/syn2020/morphodita-research/embeddings
    /usr/local/syn2020/morphodita-research/models/Current_Model

Data

Soubor SYNv11 tvoří SYNv10 a NEWTON2021.

Data jsou na grimmovi v adresáři /store/corp/SYNv11.

Postup prací

Rozdělení dat mezi stroje, postup prací.

Jednotlivé korpusy

  • SYNv8/SYNv8_a-i_:
    • tagování (26.7.-) — lovelace
    • kolokace
  • SYNv8_j-ln-z:
    • tagování — lovelace
    • kolokace
  • SYNv8_m:
    • tagování — lovelace
    • kolokace
  • NEWTON2021:
    • tagování (10.8.-11.8.2022) — grimm
    • kolokace
  • SYN2020:
    • tagování (9.8.2022) — grimm
    • kolokace (9.8.-10.8.2022) — grimm
    • vert-corr (10.8.2022) — grimm

Adresář

  • lovelace: ~/cnk-home/SYNv11
  • grimm: /store/corp/SYNv11

QR Code
QR Code wiki:user:skoumal:infra:synv11 (generated for current page)