Next: Instalace makra ICorpExport
Up: Přílohy
Previous: Přílohy
Obsah
Co dělá makro ICorpExport
- Úpravy nutné pro zpracování v programu ParaConc – změny,
které je nutné do textu zanést, aby ho bylo možné korektně
zobrazovat v programu ParaConc:
- Převedení do podoby holého textu v jednobytovém kódování,
které je schopné ParaConc zobrazit v závislosti na volbě znakové
sady (při načtení do ParaConku se znaková sada volí pro
jednotlivé jazyky v položce Skript).
- Nahrazení některých znaků, které je třeba vyhradit pro
značkování (<,>, &).
- Znaky, které v
dané sadě nemají svůj kód, se převádějí do podoby nezávislé na
použitém kódu – do takzvaných znakových entit, řetězců
začínajících znakem & a končících
;. Tak třeba řetězec „à“ reprezentuje písmeno
à. Seznam znakových entit najdete třeba zde:
http://www.evolt.org/article/ala/17/21234/.
- Další úpravy usnadňující další práci s textem
(např. nahrazení tří teček znakem „výpustek“, tedy ...).
Tyto změny jsou vratné a text v konečném formátu korpusu bude v
původním nebo požadovaném stavu.
- Změny potřebné k následnému zpracování – explicitní
vyjádření formátu textu pomocí značek jazyka HTML a úprava těchto
značek do takové podoby, aby soubor vyhovoval standardu XML.
- označení odstavců (<p id=...>)
- označení řezů písma (kurzíva, tučné písmo atd.)
Značky pro odstavce a věty budou po zarovnání použity k vytvoření
linkovacích souborů, které zajistí vlastní propojení jednotlivých
vět mezi různými jazykovými verzemi.
- Podrobnější popis funkcí makra je uveden v
příloze A.3.
Next: Instalace makra ICorpExport
Up: Přílohy
Previous: Přílohy
Obsah
Alexandr Rosen
2008-03-18