Next: Přístup do databáze
Up: Projekt InterCorp – postup
Previous: Zpracování zarovnaných textů
Obsah
Evidence textů
- Texty a jejich stav se sledují v databázi textů projektu
InterCorp na adrese http://korpus.cz/intercorp/DocDatabase/.
- Informace o jednotlivých textech nejsou součástí textů
samotných, ale jsou uloženy pouze v databázi. Vazba mezi záznamem
v databázi a vlastním textem je zajištěna pomocí identifikátoru
textu.
- Koordinátoři pro jednotlivé jazyky a ÚČNK vedou na webových stránkách projektu evidenci
textů a postupu jejich zpracování.
- U každého textu se uvádějí jeho bibliografické údaje, odkaz na
osobu, která za text odpovídá, typ textu a příznaky aktuálního
stavu zpracování. Z těchto údajů se generuje hlavička podle TEI-XML.
- Příznaky stavu textu:
- text je v papírové podobě
- text je v elektronické podobě
- text je označkován
- text je označkován ve formátu TEI-XML
- stav zarovnání (u cizojazyčných textů):
- text je zarovnán po odstavcích
- text je zarovnán po větách (automaticky)
- text je zarovnán po větách (zkontrolováno)
- Příznaky právního zajištění:
- žádná smlouva
- omezené citování
- otevřený text (nekomerčně)
- otevřený text
- ústně / s vědomím nakladatelství
Subsections
Next: Přístup do databáze
Up: Projekt InterCorp – postup
Previous: Zpracování zarovnaných textů
Obsah
Alexandr Rosen
2008-03-18