=== Zápis schůzky o transkripci 8.12.2009 + závěry ze schůzky 27. 11. 2009 === Hana, Petkevič, Rosen v reakci na problematiku materiál Chybové kódy 1 z 3.12.2009 == OBECNĚ == * Chyby, které specifikuje přepisovač, se liší od chyb, které specifikuje anotátor: přepisovač neuvádí správnou verzi. Proto bychom ty chybové kódy považovali spíše za poznámky přepisovače, které mohou pomoci anotátorovi nebo editoru vybrat odpovídající kód při opravě chyby. * Chybový kód je nepovinný, rozhodnutí o náležitosti a typu kódu bychom ponechali na libereckém teamu, sami bychom preferovali vyznačení alternativ místo kódu chyby, je-li typ chyby zřejmý. "{P|p}rotože" nebo "Protože|protože" místo "protože" nebo i "{P|p}rotože" (4. KÓD VELKÉ/MALÉ PÍSMENO) * Navrhujeme ve spolupráci s libereckým teamem sestavit seznam chyb, které se nekódují, protože jsou zřejmé už z transkripce. Navrhujeme sem zařadit všechny chyby, pro které byly navrženy kódy 1-7 z materiálu Chybové kódy: nečitelný/variantní grafém (jeden nebo více), nejistota ve věci mezery, velkého/malého písmena, tedy všechny případy, kdy lze druh chyby jednoznačně odvodit ze zápisu variant, nejistého výskytu, značky pro nečitelné řetězce XXX. == ZÁSADY TRANSKRIPCE == * formát Word 2000 a vyšší (obsahuje znakovou sadu UTF-8) * osobní data by se měla nahradit typickými představiteli daného morfologického/syntaktického typu. Například každé proprium feminina se nahradí typickým propriem feminina, například Marie apod. * kód chyby se uvádí v lomených závorkách bez mezery hned za řetězec, kterého se týká * je-li konec věty nesporný, přepisovač za ni doplní dvě mezery * odstavce se oddělují jedním prázdným řádkem (dvěma znaky pro konec odstavce) * vyhrazené znaky: < > | { } [ ] * tyto znaky se užívají pro zápis chybového kódu , variant |, uzávorkování variant a znaků/řetězců, jejichž přítomnost v rukopisu není jistá { }, rektifikací ->, uzávorkování rektifikací { } a jednoho grafému přepsaného více znaky [ ] * na české klávesnici Windows (QWERTZ) se tyto znaky zadávají současným stisknutím klávesy "pravý Alt" (někdy popsané jako "AltGraph") a další klávesy: < ... < (čárka) > ... > (tečka) | ... w { ... b } ... n [ ... f ] ... g * vyskytnou-li se tyto znaky v rukopisu, je třeba je v přepisu zdvojit: << >> || {{ }} [[ ]] == VARIANTY == * varianty se mohou uvádět více způsoby (v odstavcích jsou pod sebou vždy ekvivalentní způsoby zápisu): {Kakovského|Rakovského|Bakovského} Kakovského|Rakovského|Bakovského (jen celá slova) {K|R|B}akovského Ha{n|u} Han|Hau M{ů|a}j Můj|Maj pr{o}davá (není jasné, zda písmeno/řetězec v závorce v rukopisu je nebo není) prdavá|prodavá tělo{ }cvična (není jasné, zda tam mezera je, nebo není) {tělo cvična|tělocvična} (tady jsou závorky nutné) z{ }tělo{ }cvičny {ztělocvičny|z tělocvičny|ztělo cvičny|z tělo cvičny} Vie{ťn|t'n|tn'}amský Vieťnamský|Viet'namský|Vietn'amský * kombinace variant a kódů {Kakovského|Rakovského} (kód se týká obou variant) Kakovského|Rakovského (kód se týká druhé varianty) Kakovského|Rakovského (kódy se týkají příslušných variant) {Kakovského|Rakovského} (kódy 1 a 2 se týkají příslušných variant, kód 3 se týká obou variant) {K|R}akovského (kód se týká obou variant) {K|R}akovského (kód se týká obou variant) {K|R}akovského (kódy se týkají příslušných variant) {K|R}akovského (kódy 1 a 2 se týkají příslušných variant a, kód3 se týká obou variant) {K|R}akovského (kódy 1 a 2 se týkají příslušných variant a, kód3 se týká obou variant) == REKTIFIKACE G) == * opravil-li něco učitel, je třeba to uvést v kódu chyby, bez tohoto údaje se rozumí, že si to opravil sám student * přesuny písmen: Če{ks->sk}á * lokální přesuny slov: {Republika Česká -> Česká Republika} * přesuny (skupin) slov na větší vzdálenosti: já hrozně moc těšil {jsem se} ... kód, který vyjadřuje typ chyby a fakt, že předchozí řetězec se má přesunout někam jinam (zdroj), spolu s identifikací přesunovaného řetězce (id) ... kód, který vyjadřuje typ chyby a fakt, že řetězec označený stejným id a kódem "zdroje" má být přesunut právě sem * přesuny vět - podobně * rozdělování slov: ve||městě * odsazení odstavce: vložit kód * vsuvka do textu: Studuji {češtinu} ve škole. Studuji češtinu ve škole. Studuji {češtinu a angličtinu} ve škole. * škrtání: daný řetězec označit jako přeškrtnutý funkcí Wordu Formát/Písmo/Přeškrtnuté, chybový kód uvádět jen přeškrtl-li učitel == DIAKRITICKÁ ZNAMÉNKA == Řadu grafémů lze ve Wordu zapsat pomocí funkce Vložit/Symbol, je-li k dispozici písmo, které tento grafém obsahuje. Nedokáže-li přepisovač zapsat grafém přímo (m s čárkou, j s čárkou), zapíše písmeno bez diakritiky a další diakritická znaménka hned za něj, vše uzavřené do hranatých závorek, tedy "m s čárkou" tímto postupem: - současně stisknout klávesy "AltGraph" a "f" - stisknout klávesu "m" - stisknout klávesu s diakritickým znaménkem (exotická znaménka jsou dostupná přes klávesy s čísly při současném stisknutí klávesy AltGraph) - stisknout mezerník - současně stisknout klávesy "AltGraph" a "g" Výsledkem je zápis [m'], podobně i [j']. Závorky jsou důležité kvůli odlišení od výskytu diakritického znaménka v pozici za písmenem: [j'] (čárka nad j) vs. j' (čárka za j). == INTERPUNKCE == * Mezera před interpunkčním znaménkem nebo nemezera za ním se přepisovat nebude, tj. přepisovač bude tuto chybu sám uvádět na pravou míru. * Dvě a více interpunkčních znamének za sebou neoznačovat chybovým kódem. == OBRÁZKY H) == pes není-li přímo v textu, umístit za nejbližší odstavec == NEČITELNÉ ŘETĚZCE == * totálně nečitelné zapsat jako XXX, bez chybového kódu * jedna pravděpodobná možnost: {možnost} * více možností - viz výše varianty == CIZÍ SLOVA == * přepíší se, jak jsou