Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Následující verze | Předchozí verze | ||
wiki:user:skoumal:tahaky:syn2020 [2021/03/27 22:07] skoumal vytvořeno |
wiki:user:skoumal:tahaky:syn2020 [2022/07/26 11:21] (aktuální) skoumal [Adverbia, částice, spojky...] |
||
---|---|---|---|
Řádek 7: | Řádek 7: | ||
==== Číslovky sto, tisíc apod. ==== | ==== Číslovky sto, tisíc apod. ==== | ||
- | Na rozdíl od starších korpusů mají vždy tag **''Cz''**. Tvar **tisíc**, který se vyskytuje ve složených výrazech typu //pět tisíc padesát// má tag s genitivem a **''1''** na patnácté pozici: ''%%CzIP2---------1%%''. \\ Tvar **sto**, který se vyskytuje ve složených výrazech jako //se sto lidmi// nebo //bez sto padesáti lidí// mají tag s příslušným pádem a **''1''** na patnácté pozici: ''%%CzNS7---------1%%'', resp. ''%%CzNS2---------1%%''. | + | Na rozdíl od starších korpusů mají vždy tag **''Cz''**. |
+ | * Tvar **tisíc**, který se vyskytuje ve složených výrazech typu //pět tisíc padesát// má tag s genitivem a **''1''** na patnácté pozici: ''%%CzIP2---------1%%''. | ||
+ | * Tvar **sto**, který se vyskytuje ve složených výrazech jako //se sto lidmi// nebo //bez sto padesáti lidí// mají tag s příslušným pádem a **''1''** na patnácté pozici: ''%%CzNS7---------1%%'', resp. ''%%CzNS2---------1%%''. | ||
==== Číslovky neurčité málo, méně apod. ==== | ==== Číslovky neurčité málo, méně apod. ==== | ||
Řádek 15: | Řádek 17: | ||
| **mnoho** | ''%%Dg-------1A----%%'' | //mnoho mluví// | | | **mnoho** | ''%%Dg-------1A----%%'' | //mnoho mluví// | | ||
| | ''Ca'' | následuje "počítaný předmět" (i nepočitatelný) | | | | ''Ca'' | následuje "počítaný předmět" (i nepočitatelný) | | ||
+ | | **nemnoho** | ''%%Dg-------1N----%%'' | //o lahůdky nemnoho stojí// | | ||
+ | | | ''Ca'' | s počítaným předmětem | | ||
| **málo** | ''%%Dg-------1A----%%'' | //málo unavený//; //málo pracuje//; //málo lidí// | | | **málo** | ''%%Dg-------1A----%%'' | //málo unavený//; //málo pracuje//; //málo lidí// | | ||
| | ''Ca'' | **chybná nabídka, bude odstraněno** | | | | ''Ca'' | **chybná nabídka, bude odstraněno** | | ||
- | | | ''NN'' | //jen málo chybělo//; hlavně v dalších pádech //s málem//, //bez mála// atd. | | + | | | ''NN'' | //ani to málo//; //to málo, co//; hlavně v dalších pádech //s málem//, //bez mála// atd. | |
+ | | **nemálo** | ''%%Dg-------1N----%%'' | //nemálo hloupý//; //nemálo pracuje//; //nemálo lidí// | | ||
+ | | | ''NN'' | jen v dalších pádech, //jeden z nemála// atd. | | ||
| **víc**, **více**, **míň**, **méně**, **hodně** | ''Dg'' | jediná možnost | | | **víc**, **více**, **míň**, **méně**, **hodně** | ''Dg'' | jediná možnost | | ||
- | | **nemálo**, **nemnoho** | ''%%Dg-------1N----%%'' | //nemálo hloupý//, //o lahůdky nemnoho stojí// | | ||
- | | | ''Ca'' | s počítaným předmětem | | ||
| **pár** | ''Db'' | užito jako číslovka | | | **pár** | ''Db'' | užito jako číslovka | | ||
| | NN | //pěkný pár//, (//jeden//) //pár bot// | | | | NN | //pěkný pár//, (//jeden//) //pár bot// | | ||
Řádek 27: | Řádek 31: | ||
Tato příjmení mají vždy tag **''NN''** a ženská příjení mají lemma v ženském rodě: | Tato příjmení mají vždy tag **''NN''** a ženská příjení mají lemma v ženském rodě: | ||
- | * pan **Červený** - lemma: **Červený**, tag: **NNMS1-----A----** | + | * pan **Červený** - lemma: **Červený**, tag: **%%NNMS1-----A----%%** |
- | * paní **Červená** - lemma: **Červená**, tag: **NNFS1-----A----** | + | * paní **Červená** - lemma: **Červená**, tag: **%%NNFS1-----A----%%** |
+ | |||
+ | ==== Adverbia odvozená od adjektiv chovající se jako částice ==== | ||
+ | |||
+ | Některá adverbia odvozená od adjektiv získala význam částice. Jde o slova jako **konečně**, **zřejmě** a další. V původním adverbiálním významu je možné je stupňovat, či negovat; jako částice jsou ustrnulé v tom jediném tvaru: | ||
+ | |||
+ | ^ slovo ^ tag ^ užití ^ | ||
+ | | **konečně** | **''Dg''** | v matematickém nebo fyzikálním smyslu; na rozdíl od //nekonečně// \\ úředně: //konečně platný// (v konečném znění) | | ||
+ | | | **''TT''** | //konečně přišli//; //no konečně, to je dost// | | ||
+ | | **zřejmě** | **''Dg''** | //zřejmým způsobem// | | ||
+ | | | **''TT''** | určitý stupeň jistoty; //zřejmě už odešli// | | ||
+ | |||
+ | Podobná jsou slova **jistě**, **samozřejmě** a další. | ||
==== Zpodstatnělá přídavná jména ==== | ==== Zpodstatnělá přídavná jména ==== | ||
Je třeba posoudit, zda ve větě slovo vystupuje spíše jako adjektivum nebo substantivum, a to podle rozvití: | Je třeba posoudit, zda ve větě slovo vystupuje spíše jako adjektivum nebo substantivum, a to podle rozvití: | ||
- | * **cestující** do Brna - **AA** | + | * **cestující** do Brna - **AG** |
* spokojení **cestující** - **NN** | * spokojení **cestující** - **NN** | ||
Není-li slovo rozvito, určete podle svého citu. | Není-li slovo rozvito, určete podle svého citu. | ||
+ | |||
+ | ==== Cizí slova ==== | ||
+ | |||
+ | U cizích slov vzniká problém, zda je tagovat jako **''F%''**, nebo jako česká slov. Řídíme se hlavně tím, zda je slovo už přejaté do češtiny, hlavně zdali se skloňuje. Postupujeme takto: | ||
+ | |||
+ | * Pokud se slovo v češtině nedá skloňovat, dostane značku **''F%''**. | ||
+ | * Dá-li se skloňovat, dostane **''NN''**, i když je součástí víceslovného cizojazyčného názvu, např. //Buffalo//(**''NN''**) //Sabres//(**''F%''**); v tom případě je to 1. pád singuláru. | ||
+ | * Je-li v nabídce u cizího slova **''AA''** (např. //New//) nebo jiný slovní druh, je to chybná nabídka; v takovém případě vybereme **''F%''**, nebo **''invalid''** (pokud **''F%''** chybí). | ||
+ | * Další problém je velikost počátečního písmene u lemmatu. <del>Přijali jsme zásadu, že jestliže je v nabídce u cizího slova (tag **''F%''**) velké i malé písmeno, volíme **malé** (i když jde o součást názvu psanou s velkými počátečními písmeny).</del> Změnili jsme názor a lemma bude totožné s formou (i co do velikosti písmen). | ||
+ | |||
+ | |||
+ | ==== Novinářské šifry ==== | ||
+ | |||
+ | Zkratky jednotlivých novinářů psané v závorkách někde na začátku článku, např. **(gap)**, nebo **(zkř, opo)** budou tagované jako zkratky:<code> | ||
+ | ( ( Z:------------- | ||
+ | gap gap BN------------- | ||
+ | ) ) Z:-------------</code> | ||
===== Jednotlivá problematická slova ===== | ===== Jednotlivá problematická slova ===== | ||
Řádek 42: | Řádek 75: | ||
Mnoho slov se syntakticky chová jako adverbia, částice nebo spojky (příp. další slovní druhy) a není snadné rozhodnout, jaký mají mít tag. Zde je přehled těch nejčastějších: | Mnoho slov se syntakticky chová jako adverbia, částice nebo spojky (příp. další slovní druhy) a není snadné rozhodnout, jaký mají mít tag. Zde je přehled těch nejčastějších: | ||
- | * **ani** - //ani ryba, ani rak// je **''J^''**; jinak je to **''TT''** (//ani se neptej//) | + | ^ slovo ^ tag ^ užití ^ |
- | * **co** - zájmeno (tázací nebo vztažné) **''PQ''** je to v případě, že dokážeme určit pád (//co to je?//; //vše, co mám//); spojovací výraz časový (//od té doby, co ho znám//), též //den co den// je **''Db''**; hovorový spojovací výraz (//kluk, co přišel//) je **''J,''**; v ostatních případech je to **''TT''** | + | | **ani** | **''J^''** | //ani ryba, ani rak// | |
- | * **dál** - ve významu místním (//šli dál a dál//) je to **''Dg''**, ve významu časovém (//zpíval dál//) je to **''Db''** | + | | | **''TT''**| jinak (//ani se neptej//) | |
- | * **jak** - ve spojení //jak jeden tak druhý// je to **''J^''**; připojení vedlejší věty (//viděl ho, jak zakopl//) je **''J,''**; jakým způsobem je **''Db''** (může být obtížně odlišitelné od **''J,''**!), též //jak to?// je **''Db''** | + | | **co** | **''PQ''** | zájmeno (tázací nebo vztažné) v případě, že dokážeme určit pád (//co to je?//; //vše, co mám//) | |
- | * **jen** - synonymum k //pouze// je **''Db''**; ve spojovacím výrazu //jen co// je to **''J,''**; jinak **''TT''** (//jen tak tak//, //jen jestli!//) | + | | | **''Db''** | spojovací výraz časový (//od té doby, co ho znám//; též //den co den//); //co (možná)// + superlativ | |
- | * **již**, **už** - v časovém významu je to **''Db''** (//už přišel//); jinak je to **''TT''** (//to už nespravíš//) | + | | | **''J,''** | hovorový spojovací výraz (//kluk, co přišel//) | |
- | * **jedině**, **konečně** - jako odvozenina od //jediný//, //konečný// (jakým způsobem? //konečně//) je to **''Db''**; jinak je to **''TT''** (//jedině Tereza//, //no konečně//) | + | | | **''TT''** | v ostatních případech | |
- | * **přece** - ve spojení //a přece// je to **''J^''**; jinak je to **''TT''** | + | | **dál** | **''Dg''** | jde-li o 2. stupeň ke slovu //daleko// (//šli dál a dál//) | |
- | * **tak** - takto, takovým způsobem je **''Db''**; //jak... tak//, nebo připojení věty //(a) tak// je **''J^''**; výplňkové slovo je **''TT''**; nabídka **''II''** je chybná a bude odstraněna | + | | | **''Db''** | ostatní případy (//zpíval dál//; //pojďte dál//) | |
- | * **to** - zájmeno **''PD''** je to v případě, že dokážeme určit pád a objekt nebo situaci, na které zájmeno odkazuje; v ostatních případech je to **''TT''** (//to se nám to hezky šlape//, //to jo//) | + | | **jak** | **''J^''** | ve spojení s //tak// (//jak jeden, tak druhý//) | |
- | * **totiž** - vysvětlení, doplnění (//nerozumím mu, mluví totiž anglicky// je **''J^''**; jinak (upřesnění) je to **''TT''** (//to je totiž tak//) | + | | | **''J,''** | připojení vedlejší věty (//viděl ho, jak zakopl//) | |
- | * **třeba** - //je třeba// je **''Db''**, synonymum k //například// je **''TT''** | + | | | **''Db''** | jakým způsobem (může být obtížně odlišitelné od **''J,''**: //vyprávěl, jak jel na hory// -- buď vyprávěl o cestě (**''J,''**), anebo o tom, jakým způsobem cestoval (**''Db''**); též //jak to?// \\ **POZOR**: // jak si usteleš, tak si lehneš// je **''Db''** | |
- | * **však** - synonymum k //ale// je **''J^''**; jinak **''TT''** (//však jsem to říkal//) | + | | **jedině** | **''Db''** | //jedině Tereza// | |
+ | | | **''Dg''** | **chybná nabídka, bude odstraněna** | | ||
+ | | **jen** | **''Db''** | synonymum k //pouze// | | ||
+ | | | **''J,''** | ve spojovacím výrazu //jen co// (//jen co si lehl, usnul//)| | ||
+ | | | **''TT''** | v ostatních případech (//jen tak tak//; //jen jestli!//) | | ||
+ | | **již**, **už** | **''Db''** | v časovém významu (//už přišel//) | | ||
+ | | | **''TT''** | jinak (//to už nespravíš//) | | ||
+ | | **přece** | **''J^''** | ve spojení //a přece// | | ||
+ | | | **''TT''** | jinak | | ||
+ | | **tak** | **''Db''** | takto; takovým způsobem | | ||
+ | | | **''J^''** | //jak... tak// (//jak jeden, tak druhý//), \\ nebo připojení věty //(a) tak// (//nepřišel, tak jsme jeli sami//) \\ **POZOR**: ve větě //jak řekli, tak udělali// je //jak// i //tak// **''Db''** | | ||
+ | | | **''TT''** | výplňkové slovo | | ||
+ | | | **''II''** | **chybná nabídka, bude odstraněna** | | ||
+ | | **to** | **''PD''** | zájmeno je to v případě, že dokážeme určit pád a objekt nebo situaci, na které zájmeno odkazuje | | ||
+ | | | **''TT''** | v ostatních případech (//to se nám to hezky šlape//; //to jo//) | | ||
+ | | **totiž** | **''J^''** | vysvětlení, doplnění (//nerozumím mu, mluví totiž anglicky//) | | ||
+ | | | **''TT''** | jinak (upřesnění) (//to je totiž tak//) | | ||
+ | | **trochu** | **''NN''** | je-li zleva rozvito přívlastkem: //malou trochu//, //jakou trochu?// | | ||
+ | | | **''Db''** | jinak | | ||
+ | | **třeba** | **''Db''** | //je třeba// | | ||
+ | | | **''TT''** | synonymum k //například// | | ||
+ | | **však** | **''J^''** | synonymum k //ale// | | ||
+ | | | **''TT''** | jinak (//však jsem to říkal//) | | ||