Table of Contents

Krátký návod na práci s korpusy

Na této stránce je v krátkosti popsáno, jak pracovat s česko-ukrajinským korpusem csukr. Korpusy se nalézají na adrese https://kontext.korpus.cz.

Podrobnější návody lze nalézt na adrese https://wiki.korpus.cz/doku.php/manualy:kontext:index, kde se dá pokračovat na tutoriál a lekci o paralelních korpusech.

Výběr korpusu

Korpus, ve kterém budu hledat, zvolím po kliknutí na název aktuálního korpusu v rámečku.

Výběr korpusu

Objeví se seznam korpusů, které mám buď na seznamu oblíbených (levý sloupec), anebo patří mezi vlajkové korpusy.

Seznam korpusů

Je-li korpus v některém ze seznamů, kliknu na něj. Není-li tam, musím ho najít. Kliknu na Všechny korpusy a začnu psát název korpusu do rámečku, který se objeví. Po napsání prvních tří písmen se objeví seznam korpusů, ze kterého vyberu.

Vyhledání korpusu

Po výběru korpusu ze seznamu ho můžu přidat mezi oblíbené kliknutím na hvězdičku napravo od názvu. Je-li hvězdička modrá, je korpus mezi oblíbenými, je-li prázdná, mezi oblíbenými není.

Zadávání dotazů

Při zadávání dotazu je důležité zkontrolovat, zda zadávám jednoduchý nebo pokročilý dotaz, zda mám u jednoduchého dotazu povolené regulární výrazy, případně jaký atribut je nastavený jako výchozí.

Zadávání dotazu

Následující tři dotazy jsou ekvivalentní.

  1. Jednoduchý dotaz s povolenými regulárními výrazy a nastaveným výchozím atributem mwe_tag
    Jednoduchý dotaz
  2. Pokročilý dotaz s nastaveným výchozím atributem
    Pokročilý dotaz 1
  3. Pokročilý dotaz zapsaný v CQL (Corpus Query Language). Výchozí atribut je v tomto případě irelevantní.
    Pokročilý dotaz 2

Další tipy pro zadávání dotazu

Dotazy do korpusu csukr

Nejdříve si zvolíme korpus csukr_cs a k němu zarovnaný korpus csukr_uk.

Potřebujeme hledat frazémy, které mají určité vlastnosti, a sice přirovnání a slovesné frazémy. Přirovnání mají mwe_tag začínající na k a slovesné mají na začátku v. Nechceme ale vyhledávat všechny takové frazémy, např. složené spojky nás tolik nezajímají. Seznam hodnot na prvním a druhém místě v tagu je na stránce https://wiki.korpus.cz/doku.php/seznamy:mwe

Příklady na hledání přirovnání.

Příklady na hledání slovesných frazémů.

Vyhledané frazémy si můžeme seřadit podle frekvence. V hlavním menu klikneme na Frekvence a vybereme Vlastní…. Místo word zvolíme mwe_lemma a klikneme na Vytvořit frekvenční seznam. (Pokud se nám ukazuje graf s vodorovnými čárami, klikneme na Tabulkové zobrazení.)

Ze seznamu můžeme vybírat jednotlivé frazémy a dívat se, jak vypadá ukrajinská verze - klikneme na p nalevo od položky v seznamu (pozitivní filtr).