Table of Contents
Etalon
Zde jsou informace o tom, jak
- udržovat jednu verzi Etalonu
- navrhovat změny
- provádět změny
- provádět kontroly po provedení změn
Umístění souborů
Vše je v adresáři /data/Etalon, který má tyto další podadresáře:
tools– adresář s různými kontrolními a jinými skriptyfixed– adresář se schválenou verzí Etalonu. Zde se nic needituje, na soubory se nesahá.edit– adresář, ve kterém se provádějí změnywork– adresář, ve kterém se slévají různé verze souborů
Adresář tools
Obsahuje následující scripty:
Kontrola
check-tag-vert-tab.pl– kontroluje,- zda má řádek tři sloupce oddělená tabulátory
- zda je tag správně vytvořen
- zda je forma v základním tvaru totožná s lemmatem
Manipulace se soubory
odlep_tecky
Adresář fixed
Obsahuje všechny soubory z Etalonu v poslední verzi. Všechny soubory prošly kontrolními skripty a není v nich žádná závažná závada. Soubory jsou read-only, aby se předešlo nechtěnému přepsání.
Soubory jsou rozděleny do dvou podadresářů:
- fictree – soubory, které tvoří treebank
FicTree; soubory obsahují i syntaktickou informaci
- pubsci – zbylé soubory v Etalonu
Adresář edit
Tento adresář slouží k provádění oprav. Opět jsou v něm dva podadresáře, fictree a pubsci se stejnými soubory jako adresář fixed. V každém z podadresářů je navíc soubor README.txt, do kterého se zapisují návrhy na opravy. Poté, co jsou opravy provedeny, se návrhy z tohoto souboru opět vymažou.
Adresář work
Zde jsou spolu soubory z FicTree a Etalonu - vrt a XML se rozdělují na menší.