Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
wiki:user:skoumal:tahaky:syn2020 [2021/03/27 22:07]
skoumal vytvořeno
wiki:user:skoumal:tahaky:syn2020 [2022/07/26 11:21] (aktuální)
skoumal [Adverbia, částice, spojky...]
Řádek 7: Řádek 7:
 ==== Číslovky sto, tisíc apod. ==== ==== Číslovky sto, tisíc apod. ====
  
-Na rozdíl od starších korpusů mají vždy tag **''​Cz''​**. Tvar **tisíc**, který se vyskytuje ve složených výrazech typu //pět tisíc padesát// má tag s genitivem a **''​1''​** na patnácté pozici: ''​%%CzIP2---------1%%''​. ​\\ Tvar **sto**, který se vyskytuje ve složených výrazech jako //se sto lidmi// nebo //bez sto padesáti lidí// mají tag s příslušným pádem a **''​1''​** na patnácté pozici: ''​%%CzNS7---------1%%'',​ resp. ''​%%CzNS2---------1%%''​.+Na rozdíl od starších korpusů mají vždy tag **''​Cz''​**. ​ 
 +  * Tvar **tisíc**, který se vyskytuje ve složených výrazech typu //pět tisíc padesát// má tag s genitivem a **''​1''​** na patnácté pozici: ''​%%CzIP2---------1%%''​. ​ 
 +  * Tvar **sto**, který se vyskytuje ve složených výrazech jako //se sto lidmi// nebo //bez sto padesáti lidí// mají tag s příslušným pádem a **''​1''​** na patnácté pozici: ''​%%CzNS7---------1%%'',​ resp. ''​%%CzNS2---------1%%''​.
  
 ==== Číslovky neurčité málo, méně apod. ==== ==== Číslovky neurčité málo, méně apod. ====
Řádek 15: Řádek 17:
 | **mnoho** | ''​%%Dg-------1A----%%''​ | //mnoho mluví// | | **mnoho** | ''​%%Dg-------1A----%%''​ | //mnoho mluví// |
 |  | ''​Ca''​ | následuje "​počítaný předmět"​ (i nepočitatelný) | |  | ''​Ca''​ | následuje "​počítaný předmět"​ (i nepočitatelný) |
 +| **nemnoho** | ''​%%Dg-------1N----%%''​ | //o lahůdky nemnoho stojí// |
 +|  | ''​Ca''​ | s počítaným předmětem |
 | **málo** | ''​%%Dg-------1A----%%''​ | //málo unavený//; //málo pracuje//; //málo lidí// | | **málo** | ''​%%Dg-------1A----%%''​ | //málo unavený//; //málo pracuje//; //málo lidí// |
 |  | ''​Ca''​ | **chybná nabídka, bude odstraněno** | |  | ''​Ca''​ | **chybná nabídka, bude odstraněno** |
-|  | ''​NN''​ | //jen málo chybělo//; hlavně v dalších pádech //s málem//, //bez mála// atd. |+|  | ''​NN''​ | //ani to málo//; //to málo, co//; hlavně v dalších pádech //s málem//, //bez mála// atd. | 
 +| **nemálo** | ''​%%Dg-------1N----%%''​ | //nemálo hloupý//; //nemálo pracuje//; //nemálo lidí// | 
 +|  | ''​NN''​ | jen v dalších pádech, //jeden z nemála// atd. |
 | **víc**, **více**, **míň**, **méně**, **hodně** | ''​Dg''​ | jediná možnost | | **víc**, **více**, **míň**, **méně**, **hodně** | ''​Dg''​ | jediná možnost |
-| **nemálo**,​ **nemnoho** | ''​%%Dg-------1N----%%''​ | //nemálo hloupý//, //o lahůdky nemnoho stojí// | 
-|  | ''​Ca''​ | s počítaným předmětem | 
 | **pár** | ''​Db''​ | užito jako číslovka | | **pár** | ''​Db''​ | užito jako číslovka |
 |  | NN | //pěkný pár//, (//jeden//) //pár bot// | |  | NN | //pěkný pár//, (//jeden//) //pár bot// |
Řádek 27: Řádek 31:
  
 Tato příjmení mají vždy tag **''​NN''​** a ženská příjení mají lemma v ženském rodě: Tato příjmení mají vždy tag **''​NN''​** a ženská příjení mají lemma v ženském rodě:
-  * pan **Červený** - lemma: **Červený**,​ tag: **NNMS1-----A----** +  * pan **Červený** - lemma: **Červený**,​ tag: **%%NNMS1-----A----%%** 
-  * paní **Červená** - lemma: **Červená**,​ tag: **NNFS1-----A----**+  * paní **Červená** - lemma: **Červená**,​ tag: **%%NNFS1-----A----%%** 
 + 
 +==== Adverbia odvozená od adjektiv chovající se jako částice ==== 
 + 
 +Některá adverbia odvozená od adjektiv získala význam částice. Jde o slova jako **konečně**,​ **zřejmě** a další. V původním adverbiálním významu je možné je stupňovat, či negovat; jako částice jsou ustrnulé v tom jediném tvaru: 
 + 
 +^ slovo ^ tag ^ užití ^ 
 +| **konečně** | **''​Dg''​** | v matematickém nebo fyzikálním smyslu; na rozdíl od //​nekonečně//​ \\ úředně: //konečně platný// (v konečném znění) | 
 +| | **''​TT''​** | //konečně přišli//; //no konečně, to je dost// | 
 +| **zřejmě** | **''​Dg''​** | //zřejmým způsobem// | 
 +| | **''​TT''​** | určitý stupeň jistoty; //zřejmě už odešli// | 
 + 
 +Podobná jsou slova **jistě**, **samozřejmě** a další.
  
 ==== Zpodstatnělá přídavná jména ==== ==== Zpodstatnělá přídavná jména ====
  
 Je třeba posoudit, zda ve větě slovo vystupuje spíše jako adjektivum nebo substantivum,​ a to podle rozvití: Je třeba posoudit, zda ve větě slovo vystupuje spíše jako adjektivum nebo substantivum,​ a to podle rozvití:
-  * **cestující** do Brna - **AA**+  * **cestující** do Brna - **AG**
   * spokojení **cestující** - **NN**   * spokojení **cestující** - **NN**
 Není-li slovo rozvito, určete podle svého citu. Není-li slovo rozvito, určete podle svého citu.
 +
 +==== Cizí slova ====
 +
 +U cizích slov vzniká problém, zda je tagovat jako **''​F%''​**,​ nebo jako česká slov. Řídíme se hlavně tím, zda je slovo už přejaté do češtiny, hlavně zdali se skloňuje. Postupujeme takto:
 +
 +  * Pokud se slovo v češtině nedá skloňovat, dostane značku **''​F%''​**.
 +  * Dá-li se skloňovat, dostane **''​NN''​**,​ i když je součástí víceslovného cizojazyčného názvu, např. //​Buffalo//​(**''​NN''​**) //​Sabres//​(**''​F%''​**);​ v tom případě je to 1. pád singuláru.
 +  * Je-li v nabídce u cizího slova **''​AA''​** (např. //New//) nebo jiný slovní druh, je to chybná nabídka; v takovém případě vybereme **''​F%''​**,​ nebo **''​invalid''​** (pokud **''​F%''​** chybí).
 +  * Další problém je velikost počátečního písmene u lemmatu. <​del>​Přijali jsme zásadu, že jestliže je v nabídce u cizího slova (tag **''​F%''​**) velké i malé písmeno, volíme **malé** (i když jde o součást názvu psanou s velkými počátečními písmeny).</​del>​ Změnili jsme názor a lemma bude totožné s formou (i co do velikosti písmen).
 +
 +
 +==== Novinářské šifry ====
 +
 +Zkratky jednotlivých novinářů psané v závorkách někde na začátku článku, např. **(gap)**, nebo **(zkř, opo)** budou tagované jako zkratky:<​code>​
 +(       ​( ​      ​Z:​-------------
 +gap     ​gap ​    ​BN-------------
 +)       ​) ​      ​Z:​-------------</​code>​
  
 ===== Jednotlivá problematická slova ===== ===== Jednotlivá problematická slova =====
Řádek 42: Řádek 75:
  
 Mnoho slov se syntakticky chová jako adverbia, částice nebo spojky (příp. další slovní druhy) a není snadné rozhodnout, jaký mají mít tag. Zde je přehled těch nejčastějších:​ Mnoho slov se syntakticky chová jako adverbia, částice nebo spojky (příp. další slovní druhy) a není snadné rozhodnout, jaký mají mít tag. Zde je přehled těch nejčastějších:​
-  * **ani** ​- //ani ryba, ani rak// je **''​J^''​**; jinak je to **''​TT''​** (//ani se neptej//) +^ slovo ^ tag ^ užití ^ 
-  ​* ​**co** ​- zájmeno (tázací nebo vztažné) ​**''​PQ''​** ​je to v případě, že dokážeme určit pád (//co to je?//; //vše, co mám//)spojovací výraz časový (//od té doby, co ho znám//), též //den co den// je **''​Db''​**hovorový spojovací výraz (//kluk, co přišel//​) ​je **''​J,''​**v ostatních případech ​je to **''​TT''​** +**ani** ​**''​J^''​** ​| //ani ryba, ani rak// | 
-  * **dál** ​ve významu místním ​(//šli dál a dál//​) ​je to **''​Dg''​**, ve významu časovém ​(//zpíval dál//​) ​je to **''​Db''​** +| | **''​TT''​**| jinak (//ani se neptej//​) ​| 
-  * **jak** - ve spojení //jak jeden tak druhý// ​je to **''​J^''​**připojení vedlejší věty (//viděl ho, jak zakopl//​) ​je **''​J,''​**jakým způsobem ​je **''​Db''​** ​(může být obtížně odlišitelné od **''​J,''​**!), též //jak to?// je **''​Db''​** +**co** ​**''​PQ''​** ​| zájmeno (tázací nebo vztažné) ​v případě, že dokážeme určit pád (//co to je?//; //vše, co mám//​) ​
-  * **jen** - synonymum k //pouze// je **''​Db''​**; ve spojovacím výrazu ​//jen co// je to **''​J,''​**; jinak **''​TT''​** (//jen tak tak////jen jestli!//​) +| | **''​Db''​** | spojovací výraz časový (//od té doby, co ho znám//též //den co den//); //co (možná)// + superlativ | 
-  ​* ​**již**, **už** ​- v časovém významu je to **''​Db''​** (//už přišel//); jinak je to **''​TT''​** (//to už nespravíš//​) +| | **''​J,''​** ​hovorový spojovací výraz (//kluk, co přišel//​) ​
-  * **jedině**, **konečně** - jako odvozenina od //​jediný//,​ //​konečný//​ (jakým způsobem? //​konečně//​) je to **''​Db''​**; jinak je to **''​TT''​** (//jedině Tereza//, //no konečně//​) +| | **''​TT''​** ​v ostatních případech ​
-  * **přece** - ve spojení //a přece// ​je to **''​J^''​**jinak je to **''​TT''​** +| **dál** | **''​Dg''​** ​| jde-li o 2. stupeň ke slovu //​daleko// ​(//šli dál a dál//​) ​
-  * **tak** - taktotakovým způsobem ​je **''​Db''​**//jak... tak//, nebo připojení věty //(a) tak// je **''​J^''​**; výplňkové slovo je **''​TT''​**; nabídka ​**''​II''​** ​je chybná ​bude odstraněna +| | **''​Db''​** ​| ostatní případy ​(//​zpíval ​dál//; //​pojďte ​dál//​) ​
-  ​* **to** ​- zájmeno ​**''​PD''​** je to v případě, že dokážeme určit pád a objekt nebo situaci, na které zájmeno odkazuje; v ostatních případech je to **''​TT''​** (//to se nám to hezky šlape////to jo//) +| **jak** | **''​J^''​** ​ve spojení ​s //tak// (//jak jedentak druhý//) | 
-  ​* ​**totiž** ​vysvětlení,​ doplnění (//​nerozumím mu, mluví totiž anglicky// ​je **''​J^''​**jinak (upřesnění) ​je to **''​TT''​** ​(//to je totiž tak//) +| | **''​J,''​** ​připojení vedlejší věty (//viděl ho, jak zakopl//​) ​
-  * **třeba** ​//je třeba// ​je **''​Db''​**synonymum k //​například// ​je **''​TT''​** +| | **''​Db''​** ​jakým způsobem (může být obtížně odlišitelné od **''​J,''​**: //​vyprávěl,​ jak jel na hory// -- buď vyprávěl o cestě (**''​J,''​**), anebo o tom, jakým způsobem cestoval (**''​Db''​**); ​též //jak to?// \\ **POZOR**: // jak si usteleš, tak si lehneš// je **''​Db''​** ​| 
-  ​* ​**však** ​- synonymum k //ale// je **''​J^''​**; jinak **''​TT''​** (//však jsem to říkal//)+**jedině** **''​Db''​** | //jedině Tereza// 
 +| | **''​Dg''​** | **chybná nabídka, bude odstraněna** | 
 +| **jen** | **''​Db''​** ​| synonymum k //pouze// 
 +| | **''​J,''​** ​| ve spojovacím výrazu //jen co// (//jen co si lehl, usnul//)| 
 +| | **''​TT''​** ​| v ostatních případech ​(//jen tak tak////jen jestli!//​) ​| 
 +**již**, **už** ​**''​Db''​** ​| v časovém významu ​(//už přišel//​) ​
 +| | **''​TT''​** ​| jinak (//to už nespravíš//​) ​| 
 +**přece** **''​J^''​** ​ve spojení //a přece// ​|  
 +| | **''​TT''​** ​jinak 
 +| **tak** | **''​Db''​** ​taktotakovým způsobem ​
 +| | **''​J^''​** ​//jak... tak// (//jak jeden, tak druhý//)\\ nebo připojení věty //(a) tak// (//​nepřišel,​ tak jsme jeli sami//) \\ **POZOR**: ve větě //jak řekli, tak udělali// je //jak// i //​tak// ​**''​Db''​** ​
 +| | **''​TT''​** ​| výplňkové slovo | 
 +| | **''​II''​** ​| **chybná ​nabídka, ​bude odstraněna** | 
 +**to** ​**''​PD''​** ​| zájmeno ​je to v případě, že dokážeme určit pád a objekt nebo situaci, na které zájmeno odkazuje ​
 +| | **''​TT''​** ​| v ostatních případech ​(//to se nám to hezky šlape////to jo//) | 
 +**totiž** ​| **''​J^''​** | vysvětlení,​ doplnění (//​nerozumím mu, mluví totiž anglicky//) | 
 +| | **''​TT''​** ​jinak (upřesnění) ​(//to je totiž tak//) | 
 +| **trochu** | **''​NN''​** ​| je-li zleva rozvito přívlastkem: ​//malou trochu//, //jakou trochu?// | 
 +| | **''​Db''​** | jinak | 
 +**třeba** ​| **''​Db''​** | //je třeba// ​
 +| | **''​TT''​** ​synonymum k //​například// ​| 
 +**však** ​**''​J^''​** ​| synonymum k //ale// | 
 +| | **''​TT''​** ​| jinak (//však jsem to říkal//​) ​|
  

QR Code
QR Code wiki:user:skoumal:tahaky:syn2020 (generated for current page)