Wiki spuštěna 24. 7. 2025

Věšení informací k tagům

Tato procedura slouží tomu, abychom skrz Jägerovu konverzi propašovali do XML kolokace, slovníková lemmata s ocásky apod. Milena přidá kolokace a slovníková lemmata. Adresáře:

  • vert - hotové vertikály, které se mají prohnat Jägerem
  • vert-byt-kolok - pouze sloupec s kolokacemi a analytickými tvary; analytické tvary používat nebudeme
  • vert-etalon-synt-lex-se-kond - syntaktická vertikála se slovníkovými lemmaty a reflexivy tantum; reflexiva tantum používat nebudeme
  • vert-lemmata - syntaktická vertikála se vším, co chceme doplnit
    • vert-lemmata/1-3 - první tři sloupce: tvar, lemma, tag
    • vert-lemmata/4-6 - druhé tři sloupce: syntfce, pořadí uzlu, řídící uzel
    • vert-lemmata/7-8 - poslední dva sloupce (vlastně jen jeden): kolokace, lemmata atd.

K prvním třem sloupcům se za podtržítkem pověsí poslední slopec a nakonec 4.-6. sloupec:

paste -d'_' 1-3/vert-tri01-01 7-8/vert-tri01-01 | perl -pe 's/_$//' |\
paste - 4-6/vert-tri01-01 | perl -pe 's/\t$//'

QR Code
QR Code wiki:user:skoumal:ocasky (generated for current page)