Next: Segmentace po větách
Up: Export textů z editoru
Previous: Export textů z editoru
Obsah
- Po překontrolování textu a zajištění úprav vyžadovaných při skenování (viz
část 3) spusťte makro ICorpExport, které soubor
uloží v požadovaném formátu s příponou .txt.
- Podrobný návod k použití makra najdete v
příloze A.3. Zde uvádíme jeho stručnou verzi.
- Nejprve si soubor uložte na jiné místo nebo pod jiným názvem,
abyste se k němu mohli vrátit. Makro soubor před konverzí
automaticky ukládá i s případnými změnami, které v něm během kontrol
před exportem provedete.
- Makro ICorpExport spustíte klepnutím na příslušné tlačítko na
nástrojové liště (pokud bylo při instalaci makra vytvořeno), nebo
přes nabídku Nástroje→Makro→Makra.
- Pokud makro zjistí, že mezi některými dvěma odstavci není
prázdný řádek, přeruší svůj běh a umožní Vám prázdný řádek vložit na
zvýrazněné místo.
- V dalším textu se může tento problém opakovat, proto doporučujeme
zbytek textu zkontrolovat makrem CheckParagraphs a makro
ICorpExport spustit znovu, teprve až dojdete na konec textu.
- Makro ICorpExport se zarazí také v případě, že text
obsahuje tabulky nebo obrázky, s nimiž si neví rady. Takový objekt
lze smazat nebo – je-li žádoucí, aby obsah tabulky byl v korpusu
obsažen – převést na text. Můžete to zkusit třeba v Wordu funkcí
Tabulka→Převést→Tabulku na text.
- Makro se vás ještě zeptá, kam se má exportovaný soubor s
příponou .txt uložit.
- Makro se pak zeptá ještě jednou, a to na znakovou sadu
odpovídající jazyku textu. Zvolte jednu z následujících možností:
- středoevropská pro češtinu, slovenštinu, polštinu,
maďarštinu, chorvatštinu, slovinštinu
- západní pro angličtinu, němčinu, italštinu,
španělštinu, francouzštinu, portugalštinu, nizozemštinu,
norštinu, švédštinu, finštinu, dánštinu
- pobaltská pro litevštinu a lotyštinu
- cyrilika pro ruštinu, ukrajinštinu, bulharštinu, srbštinu, makedonštinu
- arabská pro arabštinu
- Před ukončením program dvakrát čeká, až stisknete tlačítko OK.
- Po exportu předejte text koordinátorovi pro příslušný jazyk,
který ověří bezchybnost textu a pak ho předá do ÚČNK k registraci a
označení hranic vět. Kromě vyexportovaného souboru ve formátu
.txt je nutné odevzdat i původní soubor soubor
.doc nebo .rtf.
- ÚČNK vrátí takto zpracovaný text koordinátorovi pro
daný jazyk k zarovnání (viz část 5).
Next: Segmentace po větách
Up: Export textů z editoru
Previous: Export textů z editoru
Obsah
Alexandr Rosen
2008-03-18