Table of Contents
Etalon
Zde jsou informace o tom, jak
- udržovat jednu verzi Etalonu
- navrhovat změny
- provádět změny
- provádět kontroly po provedení změn
Umístění souborů
Vše je v adresáři /data/Etalon
, který má tyto další podadresáře:
tools
– adresář s různými kontrolními a jinými skriptyfixed
– adresář se schválenou verzí Etalonu. Zde se nic needituje, na soubory se nesahá.edit
– adresář, ve kterém se provádějí změnywork
– adresář, ve kterém se slévají různé verze souborů
Adresář tools
Obsahuje následující scripty:
Kontrola
check-tag-vert-tab.pl
– kontroluje,- zda má řádek tři sloupce oddělená tabulátory
- zda je tag správně vytvořen
- zda je forma v základním tvaru totožná s lemmatem
Manipulace se soubory
odlep_tecky
Adresář fixed
Obsahuje všechny soubory z Etalonu v poslední verzi. Všechny soubory prošly kontrolními skripty a není v nich žádná závažná závada. Soubory jsou read-only, aby se předešlo nechtěnému přepsání.
Soubory jsou rozděleny do dvou podadresářů:
- fictree – soubory, které tvoří treebank
FicTree
; soubory obsahují i syntaktickou informaci
- pubsci – zbylé soubory v Etalonu
Adresář edit
Tento adresář slouží k provádění oprav. Opět jsou v něm dva podadresáře, fictree
a pubsci
se stejnými soubory jako adresář fixed
. V každém z podadresářů je navíc soubor README.txt
, do kterého se zapisují návrhy na opravy. Poté, co jsou opravy provedeny, se návrhy z tohoto souboru opět vymažou.
Adresář work
Zde jsou spolu soubory z FicTree a Etalonu - vrt a XML se rozdělují na menší.