next up previous contents
Next: Načtení textů do programu Up: Projekt InterCorp – postup Previous: Segmentace po větách   Obsah


Zarovnávání

Při zarovnávání se k sobě srovnají jednotlivé odstavce, ParaConc poté automaticky, na základě hranic vět a jejich délky, přiřadí k českému textu text cizí po úsecích –- segmentech, které může tvořit jedna nebo více vět. V ideálním případě by ParaConc měl přiřadit jedné české větě jednu větu z druhého jazyka (zarovnání 1:1). Pokud tuto dvojici nelze sestavit (na jedné straně je např. souvětí, zatímco na druhé dvě věty jednoduché), provede se zarovnání 1:2, 2:1, nebo i 1:3 a podobně.

V tabulce 1 je uveden příklad vstupních souborů. Nastavíte-li při exportu identifikaci segmentu pomocí značek <seg id="n"> ... </seg>, budou výstupní soubory vypadat jako v tabulce 2.



Subsections
next up previous contents
Next: Načtení textů do programu Up: Projekt InterCorp – postup Previous: Segmentace po větách   Obsah
Alexandr Rosen 2008-03-18