Zápis schůzky o transkripci 8.12.2009 + závěry ze schůzky 27. 11. 2009
Hana, Petkevič, Rosen
v reakci na problematiku materiál Chybové kódy 1 z 3.12.2009
OBECNĚ
Chyby, které specifikuje přepisovač, se liší od chyb, které specifikuje anotátor: přepisovač neuvádí správnou verzi. Proto bychom ty chybové kódy považovali spíše za poznámky přepisovače, které mohou pomoci anotátorovi nebo editoru vybrat odpovídající kód při opravě chyby.
Chybový kód je nepovinný, rozhodnutí o náležitosti a typu kódu bychom ponechali na libereckém teamu, sami bychom preferovali vyznačení alternativ místo kódu chyby, je-li typ chyby zřejmý.
“{P|p}rotože” nebo “Protože|protože” místo “protože<kód_chyby>” nebo i “{P|p}rotože<kód_chyby>” (4. KÓD VELKÉ/MALÉ PÍSMENO)
Navrhujeme ve spolupráci s libereckým teamem sestavit seznam chyb, které se nekódují, protože jsou zřejmé už z transkripce. Navrhujeme sem zařadit všechny chyby, pro které byly navrženy kódy 1-7 z materiálu Chybové kódy: nečitelný/variantní grafém (jeden nebo více), nejistota ve věci mezery, velkého/malého písmena, tedy všechny případy, kdy lze druh chyby jednoznačně odvodit ze zápisu variant, nejistého výskytu, značky pro nečitelné řetězce XXX.
ZÁSADY TRANSKRIPCE
formát Word 2000 a vyšší (obsahuje znakovou sadu UTF-8)
osobní data by se měla nahradit typickými představiteli daného morfologického/syntaktického typu. Například každé proprium feminina se nahradí typickým propriem feminina, například Marie apod.
kód chyby se uvádí v lomených závorkách bez mezery hned za řetězec, kterého se týká
je-li konec věty nesporný, přepisovač za ni doplní dvě mezery
odstavce se oddělují jedním prázdným řádkem (dvěma znaky pro konec odstavce)
vyhrazené znaky: < > | { } [ ]
tyto znaky se užívají pro zápis chybového kódu <kód>, variant |, uzávorkování variant a znaků/řetězců, jejichž přítomnost v rukopisu není jistá { }, rektifikací →, uzávorkování rektifikací { } a jednoho grafému přepsaného více znaky [ ]
na české klávesnici Windows (QWERTZ) se tyto znaky zadávají současným stisknutím klávesy “pravý Alt” (někdy popsané jako “AltGraph”) a další klávesy:
< ... < (čárka)
> ... > (tečka)
| ... w
{ ... b
} ... n
[ ... f
] ... g
<< >> || {{ }} [[ ]]
VARIANTY
{Kakovského|Rakovského|Bakovského}
Kakovského|Rakovského|Bakovského (jen celá slova)
{K|R|B}akovského
Ha{n|u}
Han|Hau
M{ů|a}j
Můj|Maj
pr{o}davá (není jasné, zda písmeno/řetězec v závorce v rukopisu je nebo není)
prdavá|prodavá
tělo{ }cvična (není jasné, zda tam mezera je, nebo není)
{tělo cvična|tělocvična} (tady jsou závorky nutné)
z{ }tělo{ }cvičny
{ztělocvičny|z tělocvičny|ztělo cvičny|z tělo cvičny}
Vie{ťn|t'n|tn'}amský
Vieťnamský|Viet'namský|Vietn'amský
{Kakovského|Rakovského}<kód> (kód se týká obou variant)
Kakovského|Rakovského<kód> (kód se týká druhé varianty)
Kakovského<kód1>|Rakovského<kód2> (kódy se týkají příslušných variant)
{Kakovského<kód1>|Rakovského<kód2>}<kód3> (kódy 1 a 2 se týkají příslušných variant, kód 3 se týká obou variant)
{K|R}<kód>akovského (kód se týká obou variant)
{K|R}akovského<kód> (kód se týká obou variant)
{K<kód1>|R<kód2>}akovského (kódy se týkají příslušných variant)
{K<kód1>|R<kód2>}<kód3>akovského (kódy 1 a 2 se týkají příslušných variant a, kód3 se týká obou variant)
{K<kód1>|R<kód2>}akovského<kód3> (kódy 1 a 2 se týkají příslušných variant a, kód3 se týká obou variant)
REKTIFIKACE G)
opravil-li něco učitel, je třeba to uvést v kódu chyby, bez tohoto údaje se rozumí, že si to opravil sám student
přesuny písmen: Če{ks→sk}á
lokální přesuny slov: {Republika Česká → Česká Republika}
přesuny (skupin) slov na větší vzdálenosti:
já <kód-cíl-id> hrozně moc těšil {jsem se}<kód-zdroj-id>
<kód-zdroj-id> ... kód, který vyjadřuje typ chyby a fakt, že předchozí řetězec se má přesunout někam jinam (zdroj), spolu s identifikací přesunovaného řetězce (id)
<kód-cíl-id> ... kód, který vyjadřuje typ chyby a fakt, že řetězec označený stejným id a kódem "zdroje" má být přesunut právě sem
Studuji {češtinu}<kód> ve škole.
Studuji češtinu<kód> ve škole.
Studuji {češtinu a angličtinu}<kód> ve škole.
daný řetězec označit jako přeškrtnutý funkcí Wordu Formát/Písmo/Přeškrtnuté,
chybový kód uvádět jen přeškrtl-li učitel
DIAKRITICKÁ ZNAMÉNKA
Řadu grafémů lze ve Wordu zapsat pomocí funkce Vložit/Symbol, je-li k dispozici písmo, které tento grafém obsahuje. Nedokáže-li přepisovač zapsat grafém přímo (m s čárkou, j s čárkou), zapíše písmeno bez diakritiky a další diakritická znaménka hned za něj, vše uzavřené do hranatých závorek, tedy “m s čárkou” tímto postupem:
současně stisknout klávesy “AltGraph” a “f”
stisknout klávesu “m”
stisknout klávesu s diakritickým znaménkem (exotická znaménka jsou dostupná přes klávesy s čísly při současném stisknutí klávesy AltGraph)
stisknout mezerník
současně stisknout klávesy “AltGraph” a “g”
Výsledkem je zápis [m'], podobně i [j']. Závorky jsou důležité kvůli odlišení od výskytu diakritického znaménka v pozici za písmenem: [j'] (čárka nad j) vs. j' (čárka za j).
INTERPUNKCE
Mezera před interpunkčním znaménkem nebo nemezera za ním se přepisovat nebude, tj. přepisovač bude tuto chybu sám uvádět na pravou míru.
Dvě a více interpunkčních znamének za sebou neoznačovat chybovým kódem.
OBRÁZKY H)
<img alt="pes">
není-li přímo v textu, umístit za nejbližší odstavec
NEČITELNÉ ŘETĚZCE
totálně nečitelné zapsat jako XXX, bez chybového kódu
jedna pravděpodobná možnost: {možnost}<kód>
více možností - viz výše varianty
CIZÍ SLOVA