Česko-polské slovníky lemmat vytvořené na základě zarovnání po slovech programem GIZA++ z beletristické části česko-polského paralelního korpusu InterCorp v. 6. Byly vybrány jen segmenty zarovnané 1:1. Kvantitativní údaje viz níže. 24.7.2014 přidány další tři slovníky: česko-anglický, česko-německý a česko-španělský. Všechny byly vytvořeny stejným způsobem jako slovník česko-polský, jsou však jen v jedné verzi, ve formátu .ods (tabulkový procesor Open Office), bez jakýchkoli ručních zásahů, setříděné primárně abecedně podle češtiny a sekundárně retrográdně podle počtu výskytů. czeskie texty: 11 885 KW polskie texty: 11 860 KW wyekstraktowane pary lemmatów: 8 651 K wyekstraktowane hasła dwujęzyczne: 528 K Polsko-český i česko-polský slovník má v prvním sloupci frekvence lemat a každý z nich je ve 4 verzích: A. textový formát B. formát excel C. textový formát setříděný retrográdně (a tergo) D. formát excel setříděný retrográdně (a tergo) Heslo v A a B jsou setříděna postupně podle: 1. prvního jazyka 2. frekvence 3. druhého jazyka Hesla v C a D jsou setříděna postupně podle: 1. prvního jazyka (retrográdně) 2. druhého jazyka (retrográdně) 27.3. Dva xls soubory s deminutivními sufixy: cspl_demin.xlsx plcs_demin.xlsx A - počet dvojic cs-pl lemmat B - cs lemma C - pl lemma D - cs lemma a tergo E - pl lemma a tergo F - cs deminutivum G - pl deminutivum V F a G je deminutivní sufix, pokud ho lemma na řádku má, ale označeno mechanicky, jen podle řetězců znaků. Vyhrává vždycky konkrétnější sufix, tedy např. _uszko nad _ko. Třídění v cspl_demin.xlsx: F > B > A > C Třídění v plcs_demin.xlsx: G > C > A > B CS masc: -ek -eček -íček -ec -ík -áček -ánek -ásek -ouš -oušek -ínek fem: -ka -ečka -ička -ice -inka -enka -ěnka -uška -unka neut: -ko -ečko -ičko -íčko -ce -ítko -ítečko -átko -átečko -ínko -enko -énko PL masc: -ek -eczek -iczek -yczek -ik -yk -aszek -iszek -yszek -alek -aś -uś -usiek -uszek -uszczek -ina -yna -eniek -iś -yś -unio -uń -cio -ę -ątko -ul -ulo -ulek -cio fem: -ka -eczka -iczka -yczka -ułka -uszka -ina -yna -inka -ynka -yczka -iczka -yszka -iszka -eńka -usia -uśka -uchna -unia -uńcia -ula -ulka -cia -osia -ośka neut: -ko -eczko -iczko -ątko -etko -uszko -iczko -yczko -yszko -iszko -eńko