Next: Zarovnání po odstavcích
Up: Zarovnávání
Previous: Zarovnávání
Obsah
Načtení textů do programu ParaConc
- Zarovnávat budeme označkovaný český a cizojazyčný text ve
formátu .txt1. Texty je třeba vůči
sobě zarovnat v programu ParaConc.
- Spusťte program ParaConc.
- Klepněte na File→Load Corpus File(s). Objeví se okno
Load Corpus Files.
- Nastavení v okně by mělo být takové, jak uvádíme dále.
Překontrolujte/nastavte všechny parametry v uvedeném pořadí.
- Nastavení jazyků:
- Parallel texts: 2
- Jazyk vlevo: Czech
- Jazyk vpravo: cizí jazyk (vybrat z rolovací
nabídky)
- Pokud příslušný jazyk mezi nabízenými možnostmi nenajdete, je
třeba příslušné národní prostředí do systému
doinstalovat. (Obraťte se na svého správce systému, nebo vložte
instalační CD systému Windows do mechaniky, klepněte na
Start→Nastavení→Ovládací panely→Místní
nastavení a dále postupujte podle pokynů.)
- Klepněte na tlačítko Font... pro češtinu:
- Písmo: Arial
- Skript: Středoevropský
- (Položka Skript je dole uprostřed.)
- Klepněte na OK.
- Klepněte na tlačítko Font... pro cizí jazyk:
- Písmo: Arial
- Skript: – podle odpovídající znakové
sady:
- Středoevropský pro češtinu, slovenštinu, polštinu,
maďarštinu, chorvatštinu, slovinštinu
- Západní pro angličtinu, němčinu, italštinu,
španělštinu, francouzštinu, portugalštinu, nizozemštinu,
norštinu, švédštinu, finštinu, dánštinu
- Pobaltský pro litevštinu a lotyštinu
- Cyrilika pro ruštinu, ukrajinštinu, bulharštinu, srbštinu, makedonštinu
- Arabský pro arabštinu
- Klepněte na OK.
- Nyní je třeba nastavit informace o zarovnávání:
- Align format: Not Aligned
- (To je položka úplně dole, ale je třeba s ní začít.)
- Vraťte se doprostřed okna pod tlačítko Font... a
pro český i cizojazyčný text provedeme nastavení formátu. Klepněte
na příslušné tlačítko Format.... U obou
jazyků je nastavení stejné:
- Headings: Regular expression –- hodnota prázdná, neboť
nadpisy neoznačujeme
- Paragraphs: HTML/SGML Markers
- start tag: p
- stop tag: /p
- Sentences: HTML/SGML Markers
- start tag: s
- stop tag: /s
- Klepněte na tlačítko Add a vyberte správný soubor s
příponou .txt1. To proveďte u obou jazyků. Pak klepněte na
tlačítko OK.
- Po klepnutí na tlačítko OK v okně Load Corpus Files
se pravděpodobně objeví chybové hlášení o tom, že počet sekcí nebo odstavců se
v obou textech liší. Tuto chybu odstraníme při zarovnání.
- Pokud počet odstavců odpovídá, na obrazovce
se žádná tabulka neobjeví. I tak je nutné zkontrolovat, zda jsou
odstavce zarovnány správně. To proto, že zarovnání nemusí být
v pořádku, i když počet odstavců souhlasí. Tabulku zarovnávání lze
otevřít takto:
- Zvolte nabídku File→View Corpus Alignment nebo
použijte klávesovou zkratku CTRL+V.
- Objeví se okno s vybranými soubory, klepněte na
název souboru a poté dole na tlačítko Alignment.
- Měla by se objevit tabulka s přiřazením sekcí a další s
přiřazením segmentů (vět). Objeví-li se jen jedna s přiřazením sekcí
(obsahuje jedinou sekci zobrazenou jako jeden řádek textu), zkuste
ji minimalizovat („srolovat“), měla by se ukázat i tabulka
s přiřazením sekcí.
- Mezi přiřazením vět a odstavců lze přepínat v nabídce
Alignment→Paragraphs a Alignment→Aligned Sentences
Next: Zarovnání po odstavcích
Up: Zarovnávání
Previous: Zarovnávání
Obsah
Alexandr Rosen
2008-03-18