Korpus SYNv9
Korpus sestává z těchto dílčích korpusů:
grimm
:/store/corp/SYNv9/SYNv8_new
:SYNv8_a-i_
SYNv8_j-ln-z
SYNv8_m
sag
:/data1/SYNv9
:NEWTON2019
SYN2020
Zpracovává se skripty pro SYN2020
:
process_text.sh
provede lemmatizaci a tagováníprocess_kolok.sh
přidá kolokaceprocess_prislovi.sh
přidá další přísloví a provede závěrečné opravy
Datum poslední úpravy:
- Kolokace: 2021, Mar 12 15:34
tabfraz_UTF8_prislovi_new
: 2021, Apr 16 15:21Final_Corrections.tsv
: 2021, Apr 18 00:37
Hotové korpusy jsou v adresáři vert-prislovi-kolok-CNK
:
SYN2020
: 2021, Apr 18 21:31
Poslední opravy:
- Ligatury původním Procházkovým skriptem po deduplikaci
- Posesiva:
- Šlachtovi — Ormův
- Vrbovi — Martínkův
- tátovi — Trumpův
- Páníkovi — Trumpův
- královi — Trumpův
- Haškovi — Trumpův
- Umělcovi — Zemanův