Next: Korektury naskenovaného textu
Up: Skenování
Previous: Skenování
Obsah
Skenování a uložení textu
- Údaje z tiráže zapište do databáze (snažte se o
skenovaném textu zjistit co nejvíce informací).
- Spusťte program ABBYY FineReader. Tím se automaticky otevře
nová Nepojmenovaná dávka.
- Uvedený postup odpovídá verzi 8. U novější verze 9 jsou některé
ovládací prvky uspořádány jinak. Také z toho důvodu je třeba
uvedený postup považovat nikoli za závazný, ale pouze za jeden z
více možných. Na základě vlastních zkušeností vám
může vyhovovat jiný postup.
- V menu Soubor zvolte Uložit dávku jako... a
dávku uložte (doporučujeme vytvořit snadno identifikovatelný název,
ze kterého je hned zřejmé, o jakou knihu a verzi jde,
např. vassalli-labut-italsky). Dávka je vlastně složkou, do
které se bude ukládat úplně vše, tj. obrazy skenování, rozpoznaný
text a výsledný dokument ve Wordu.
- V okně Nástroje→Možnosti→2.Číst→Jazyk
rozpoznávání nastavte příslušný jazyk pro rozpoznávání.
- Vložte knihu do skeneru a klepněte na Skenovat. Objeví se
dialogové okno skeneru a starý obraz naposledy skenovaných
stránek. Klepněte na Preview – tím se načte aktuální obraz stránek,
které budete skenovat. Zároveň se objeví i rámeček, který většinou
přesahuje kontury vašeho textu. Nastavte rámeček tak, aby se
zbytečně neskenovalo i „okolí“. Nastavíte-li rámeček úplně přesně,
bude pak potřeba přesně zachovat polohu knihy při dalším skenování.
- Neskenujte: obsah, různé tabulky, popisky obrázků,
seznamy slov, předmluvu, doslov, tiráž.
- Klepněte na Scan. Poté, co je obraz stránek naskenován,
dialogové okno skeneru zmizí a naskenovaný obraz se objeví vlevo pod
číslem 1, a také uprostřed jako obrázek; vpravo je pak okno
textového editoru, které oznamuje Text není
rozpoznán.
- Klepněte na Číst. Je-li přečteno i něco nežádoucího
(např. čísla stránek – to když jste nastavili rámeček poněkud větší,
než bylo nutné), můžete to dodatečně vymazat tak, že kurzorem
najedete do nežádoucích zelených rámečků a stisknete delete
na klávesnici. Tyto akce ale můžete udělat také až při korekturách ve
Wordu.
- Takto pokračujte s každou stránkou – jen s tím rozdílem, že už
nebudete muset nastavovat rámeček, jestliže jste ho nastavili
správně. Doporučujeme ale ujistit se, že je naskenováno všechno –
to zjistíte třeba ve spodním okně FineReaderu, kde je obraz
zvětšený, takže je jasně vidět, zda např. nechybí spodní či horní
řádky textu.
- Text knihy musí být spojen do jednoho velkého
souboru. Až budou naskenovány všechny stránky, přistupte
k exportu (uložení) do formátu editoru MS Word. Klepněte na
Uložit. Objeví se okno, ve kterém je nutné nastavit
následující parametry:
- Název souboru:
- Vytvořte podle vzoru
capek-valka_s_mloky.bg-00.doc, tedy z příjmení
autora, pomlčky a českého názvu textu (místo mezer použijte
podtržítka), označení jazyka a verze překladu.
- Mělo by z něj být napohled jasné, o jaký text se
jedná.
- Část názvu před první tečkou nesmí být delší než 22 znaků
(podle potřeby zkraťte název díla či příjmení autora).
- Název může obsahovat velká i malá písmena bez diakritiky,
dále podtržítka a jednu pomlčku (k oddělení příjmení autora a
názvu textu).
- Musí přesně odpovídat ID textu v databázi, včetně rozdílu
mezi velkými a malými písmeny.
- Uložit jako typ: Rich Text Format (.rtf).
- Uložit strany: Všechny strany (zaškrtnout tuto
volbu, nikoli jen vybrané strany!)
- Volby souboru: Vytvořit samostatný soubor pro
všechny stránky.
- Zachování nastavení: Zachovat font a velikost
fontu.
- Uchovat obrázky: zrušit, je-li zaškrtnuto.
- Vedle Uchovat obrázky je volba Nastavení
formátů – klepněte na ni, a pak zaškrtněte Odstranit
volitelné spojovníky.
- Pak klepněte na Uložit.
- Uložený text je třeba zkorigovat. To lze provádět na libovolném
počítači s editorem, který si poradí s formátem
.rtf. Pokyny ke korekturám viz
část 3.2. Konverzi do textového formátu před
zarovnáním pomocí makra ICorpExport je však možné provést pouze v
editoru MS Word (viz část 4.1).
Next: Korektury naskenovaného textu
Up: Skenování
Previous: Skenování
Obsah
Alexandr Rosen
2008-03-18