next up previous contents
Next: Přístup do databáze Up: Projekt InterCorp – postup Previous: Zpracování zarovnaných textů   Obsah


Evidence textů

  1. Texty a jejich stav se sledují v databázi textů projektu InterCorp na adrese http://korpus.cz/intercorp/DocDatabase/.
  2. Informace o jednotlivých textech nejsou součástí textů samotných, ale jsou uloženy pouze v databázi. Vazba mezi záznamem v databázi a vlastním textem je zajištěna pomocí identifikátoru textu.
  3. Koordinátoři pro jednotlivé jazyky a ÚČNK vedou na webových stránkách projektu evidenci textů a postupu jejich zpracování.
  4. U každého textu se uvádějí jeho bibliografické údaje, odkaz na osobu, která za text odpovídá, typ textu a příznaky aktuálního stavu zpracování. Z těchto údajů se generuje hlavička podle TEI-XML.
  5. Příznaky stavu textu:
    1. text je v papírové podobě
    2. text je v elektronické podobě
    3. text je označkován
    4. text je označkován ve formátu TEI-XML
    5. stav zarovnání (u cizojazyčných textů):
      • text je zarovnán po odstavcích
      • text je zarovnán po větách (automaticky)
      • text je zarovnán po větách (zkontrolováno)

  6. Příznaky právního zajištění:
    1. žádná smlouva
    2. omezené citování
    3. otevřený text (nekomerčně)
    4. otevřený text
    5. ústně / s vědomím nakladatelství



Subsections
next up previous contents
Next: Přístup do databáze Up: Projekt InterCorp – postup Previous: Zpracování zarovnaných textů   Obsah
Alexandr Rosen 2008-03-18