Zápis schůzky o transkripci 8.12.2009 + závěry ze schůzky 27. 11. 2009
Hana, Petkevič, Rosen
v reakci na problematiku materiál Chybové kódy 1 z 3.12.2009
OBECNĚ
- Chyby, které specifikuje přepisovač, se liší od chyb, které specifikuje anotátor: přepisovač neuvádí správnou verzi. Proto bychom ty chybové kódy považovali spíše za poznámky přepisovače, které mohou pomoci anotátorovi nebo editoru vybrat odpovídající kód při opravě chyby.
- Chybový kód je nepovinný, rozhodnutí o náležitosti a typu kódu bychom ponechali na libereckém teamu, sami bychom preferovali vyznačení alternativ místo kódu chyby, je-li typ chyby zřejmý.
“{P|p}rotože” nebo “Protože|protože” místo “protože<kód_chyby>” nebo i “{P|p}rotože<kód_chyby>” (4. KÓD VELKÉ/MALÉ PÍSMENO)
- Navrhujeme ve spolupráci s libereckým teamem sestavit seznam chyb, které se nekódují, protože jsou zřejmé už z transkripce. Navrhujeme sem zařadit všechny chyby, pro které byly navrženy kódy 1-7 z materiálu Chybové kódy: nečitelný/variantní grafém (jeden nebo více), nejistota ve věci mezery, velkého/malého písmena, tedy všechny případy, kdy lze druh chyby jednoznačně odvodit ze zápisu variant, nejistého výskytu, značky pro nečitelné řetězce XXX.
ZÁSADY TRANSKRIPCE
- formát Word 2000 a vyšší (obsahuje znakovou sadu UTF-8)
- osobní data by se měla nahradit typickými představiteli daného morfologického/syntaktického typu. Například každé proprium feminina se nahradí typickým propriem feminina, například Marie apod.
- kód chyby se uvádí v lomených závorkách bez mezery hned za řetězec, kterého se týká
- je-li konec věty nesporný, přepisovač za ni doplní dvě mezery
- odstavce se oddělují jedním prázdným řádkem (dvěma znaky pro konec odstavce)
- vyhrazené znaky: < > | { } [ ]
- tyto znaky se užívají pro zápis chybového kódu <kód>, variant |, uzávorkování variant a znaků/řetězců, jejichž přítomnost v rukopisu není jistá { }, rektifikací →, uzávorkování rektifikací { } a jednoho grafému přepsaného více znaky [ ]
- na české klávesnici Windows (QWERTZ) se tyto znaky zadávají současným stisknutím klávesy “pravý Alt” (někdy popsané jako “AltGraph”) a další klávesy:
< ... < (čárka) > ... > (tečka) | ... w { ... b } ... n [ ... f ] ... g
- vyskytnou-li se tyto znaky v rukopisu, je třeba je v přepisu zdvojit:
<< >> || {{ }} [[ ]]
VARIANTY
- varianty se mohou uvádět více způsoby (v odstavcích jsou pod sebou vždy ekvivalentní způsoby zápisu):
{Kakovského|Rakovského|Bakovského} Kakovského|Rakovského|Bakovského (jen celá slova) {K|R|B}akovského
Ha{n|u} Han|Hau
M{ů|a}j Můj|Maj
pr{o}davá (není jasné, zda písmeno/řetězec v závorce v rukopisu je nebo není) prdavá|prodavá
tělo{ }cvična (není jasné, zda tam mezera je, nebo není) {tělo cvična|tělocvična} (tady jsou závorky nutné)
z{ }tělo{ }cvičny {ztělocvičny|z tělocvičny|ztělo cvičny|z tělo cvičny}
Vie{ťn|t'n|tn'}amský Vieťnamský|Viet'namský|Vietn'amský
- kombinace variant a kódů
{Kakovského|Rakovského}<kód> (kód se týká obou variant) Kakovského|Rakovského<kód> (kód se týká druhé varianty) Kakovského<kód1>|Rakovského<kód2> (kódy se týkají příslušných variant) {Kakovského<kód1>|Rakovského<kód2>}<kód3> (kódy 1 a 2 se týkají příslušných variant, kód 3 se týká obou variant)
{K|R}<kód>akovského (kód se týká obou variant) {K|R}akovského<kód> (kód se týká obou variant) {K<kód1>|R<kód2>}akovského (kódy se týkají příslušných variant) {K<kód1>|R<kód2>}<kód3>akovského (kódy 1 a 2 se týkají příslušných variant a, kód3 se týká obou variant) {K<kód1>|R<kód2>}akovského<kód3> (kódy 1 a 2 se týkají příslušných variant a, kód3 se týká obou variant)
REKTIFIKACE G)
- opravil-li něco učitel, je třeba to uvést v kódu chyby, bez tohoto údaje se rozumí, že si to opravil sám student
- přesuny písmen: Če{ks→sk}á
- lokální přesuny slov: {Republika Česká → Česká Republika}
- přesuny (skupin) slov na větší vzdálenosti:
já <kód-cíl-id> hrozně moc těšil {jsem se}<kód-zdroj-id> <kód-zdroj-id> ... kód, který vyjadřuje typ chyby a fakt, že předchozí řetězec se má přesunout někam jinam (zdroj), spolu s identifikací přesunovaného řetězce (id) <kód-cíl-id> ... kód, který vyjadřuje typ chyby a fakt, že řetězec označený stejným id a kódem "zdroje" má být přesunut právě sem
- přesuny vět - podobně
- rozdělování slov: ve||městě
- odsazení odstavce: vložit kód
- vsuvka do textu:
Studuji {češtinu}<kód> ve škole. Studuji češtinu<kód> ve škole.
Studuji {češtinu a angličtinu}<kód> ve škole.
- škrtání:
daný řetězec označit jako přeškrtnutý funkcí Wordu Formát/Písmo/Přeškrtnuté, chybový kód uvádět jen přeškrtl-li učitel
DIAKRITICKÁ ZNAMÉNKA
Řadu grafémů lze ve Wordu zapsat pomocí funkce Vložit/Symbol, je-li k dispozici písmo, které tento grafém obsahuje. Nedokáže-li přepisovač zapsat grafém přímo (m s čárkou, j s čárkou), zapíše písmeno bez diakritiky a další diakritická znaménka hned za něj, vše uzavřené do hranatých závorek, tedy “m s čárkou” tímto postupem:
- současně stisknout klávesy “AltGraph” a “f”
- stisknout klávesu “m”
- stisknout klávesu s diakritickým znaménkem (exotická znaménka jsou dostupná přes klávesy s čísly při současném stisknutí klávesy AltGraph)
- stisknout mezerník
- současně stisknout klávesy “AltGraph” a “g”
Výsledkem je zápis [m'], podobně i [j']. Závorky jsou důležité kvůli odlišení od výskytu diakritického znaménka v pozici za písmenem: [j'] (čárka nad j) vs. j' (čárka za j).
INTERPUNKCE
- Mezera před interpunkčním znaménkem nebo nemezera za ním se přepisovat nebude, tj. přepisovač bude tuto chybu sám uvádět na pravou míru.
- Dvě a více interpunkčních znamének za sebou neoznačovat chybovým kódem.
OBRÁZKY H)
<img alt="pes">
není-li přímo v textu, umístit za nejbližší odstavec
NEČITELNÉ ŘETĚZCE
- totálně nečitelné zapsat jako XXX, bez chybového kódu
- jedna pravděpodobná možnost: {možnost}<kód>
- více možností - viz výše varianty
CIZÍ SLOVA
- přepíší se, jak jsou